(相關資料圖)
在2023年的世界人工智能大會(WAIC)上,大模型“扎堆”。根據大會主辦方此前發布的內容,這次大會上有30多個海內外大模型登場,開發團隊或是分享大模型路徑,或是展示大模型賦能各行各業的多元生態,都爭相在大模型發展上有所行動或謀得先機。
如“雨后春筍”般出現的大模型,究竟改變了什么?
它讓“專業門檻”變低
一個初學者如果學畫畫,可能需要練個幾年,才能畫出一幅足夠專業的畫。
人工智能改變了這一情況。它讓畫畫的“專業門檻”變低,僅僅輸入一些文字,一幅美輪美奐的作品便在短時間里生成了。
在大會的一場論壇上,商湯科技董事長兼CEO徐立在生成式大模型“商湯秒畫SenseMirage3.0”上輸入一些提示詞:中國龍、藍色擺件、珠寶風格。
看似簡單,但徐立說,該大模型可以根據大眾認知,自動“補齊”提示詞,讓生成的圖片細節更豐富。
在“補齊”提示詞后,該大模型呈現的是:一張中國龍3D渲染圖,具有精細的圖案。龍站在一片藍色“瑪瑙?!鄙?,增添了深度和神秘感……
7月6日至8日,2023世界人工智能大會在上海舉辦?!∴崿摤?攝它讓“數據家族”發生改變
因為數據安全問題,很多企業不敢讓數據“流通”起來。
大模型下,“數據家族”悄然發生變化。
星環科技創始人、CEO孫元浩認為,運用大模型對數據進行分類分級,可能是個新嘗試。
他認為,大模型用的數據可以分為四類:第一類是感知類數據,如視覺數據、語音數據等。第二類是事實類數據,過去很多行業已經能將這類數據結構化,但需要借助大模型將其變化歷史找出來,組成完整語義;第三類是知識類數據,過去很多這類數據并沒有被有效利用,大模型出現以后有望助力改變這一情況;第四類數據是方法論類數據。
孫元浩說,從感知類、事實類、知識類到方法論類,所有的數據向大模型輸入時都需要轉化為大模型能理解的語言,因此“大模型時代”,數據產業鏈需要各種工具以及各種類型的數據庫,這樣才能真正把大模型用起來。
它讓產業變“活”
大模型改變了什么?這對致力于搭“數據樂高”的數庫科技創始人兼CEO劉彥來說,并不難回答。
他的團隊把SAM(Segment Analysis& Mapping)產業鏈數據體系升級為UPG(Universal Product Graph)產業鏈數據體系,“UPG不但有SAM的框架,同時它可以疊加工藝、生產環節、材質、設備等各種類型的關系?!?/p>
換句話說,大模型的出現,讓該企業搭“數字樂高”的能力更強了。
劉彥說,原來要“提煉”這些關系很難,大語言模型可以跑海量數據、快速生成這些關系,大大提高了效率。
螳螂捕蟬,黃雀在后。當大模型“運動員”越來越多的時候,大模型“考官”出現了。
今年的世界人工智能大會上,作為“鎮館之寶”之一,“蟻鑒AI安全檢測平臺2.0”(簡稱:蟻鑒2.0)受到關注。螞蟻集團大安全事業群技術部總裁李俊奎表示,“生成式大模型是一種‘深黑盒’技術,‘蟻鑒2.0’很像一個24小時不眠不休的‘安全黑客’,致力于找出大模型存在的弱點和安全問題。這種AI對AI的評測,好比‘生成式考官’考核‘生成式運動員’,也是教學相長?!?/p>7月6日至8日,2023世界人工智能大會在上海舉辦?!珡┛?攝
它讓“智能未來”更具挑戰
大模型有了,大模型下的“智能世界2.0”就能來了嗎?
還沒有。生成式大模型,以概率的方式生成內容,會生成似是而非的內容,這也被稱為“幻覺問題”。
如何讓語料更精準、讓大模型減少“幻覺問題”,業界在努力。
上海數據交易所總經理湯奇峰在大會上稱,大模型建設中,語料庫是一個非常重要的方面。上海數據交易所致力于建設高質量的語料庫,推動人工智能大模型產業的發展。
在今年的世界人工智能大會上,中國電信發布行業大模型Telechat。據中國電信數字智能科技分公司副總經理何忠江介紹,Telechat依托中國電信云網融合優勢,利用自研技術增強大模型的預訓練和推理能力,減少大模型“幻覺現象”;同時,Telechat大模型正在與千行百業的信息化解決方案進行融合,以滿足多樣場景需求。(完)