阿布扎比先進(jìn)技術(shù)研究協(xié)會(huì)(ARTC)下屬的科技創(chuàng)新研究所(TII)今天發(fā)布了兩項(xiàng)重大人工智能進(jìn)展:Falcon Arabic是Falcon系列首款阿拉伯語模型,現(xiàn)已成為該地區(qū)表現(xiàn)最佳的阿拉伯語人工智能模型,而Falcon-H1則是一款通過全新架構(gòu)設(shè)計(jì)重新定義了性能和可移植性的新模型。在中小型人工智能模型(300億至700億個(gè)參數(shù))中,F(xiàn)alcon-H1的性能超越了Meta的LlaMA和阿里巴巴的Qwen等競(jìng)品,可在日常設(shè)備和資源有限的環(huán)境中實(shí)現(xiàn)真實(shí)世界的人工智能。阿聯(lián)酋總統(tǒng)顧問兼ATRC秘書長Faisal Al Bannai閣下在“Make it in the Emirates”活動(dòng)上發(fā)表主題演講時(shí)宣布了這一消息。
Falcon Arabic建立在Falcon 3-7B(70億參數(shù))之上,是迄今為止已開發(fā)的最先進(jìn)的阿拉伯語人工智能模型之一。該模型在涵蓋現(xiàn)代標(biāo)準(zhǔn)阿拉伯語和地區(qū)方言的高質(zhì)量母語(非翻譯)阿拉伯語數(shù)據(jù)集上進(jìn)行訓(xùn)練,全面捕捉了阿拉伯世界的語言多樣性。根據(jù)開放式阿拉伯語LLM排行榜基準(zhǔn),F(xiàn)alcon Arabic優(yōu)于所有其他地區(qū)可用的阿拉伯語模型,鞏固了其在主權(quán)多語言人工智能領(lǐng)域的領(lǐng)先地位。作為同類產(chǎn)品中表現(xiàn)最佳的阿拉伯語模型,其性能可媲美10倍于其規(guī)模的模型,從而證明了智能架構(gòu)可以超越單純的規(guī)模。
另外,新推出的Falcon-H1模型旨在通過降低運(yùn)行高級(jí)系統(tǒng)通常所需的計(jì)算能力和專業(yè)技術(shù)知識(shí),大幅擴(kuò)大高性能人工智能的使用范圍。作為新模型的基礎(chǔ),TII的Falcon 3系列在單個(gè)圖形處理器(GPU)上運(yùn)行的人工智能模型在全球名列前茅,這項(xiàng)重大突破使不具備高端基礎(chǔ)設(shè)施的開發(fā)人員、初創(chuàng)企業(yè)和機(jī)構(gòu)能夠以可承受的價(jià)格部署尖端人工智能。
“我們?yōu)榻K于將阿拉伯語帶入Falcon感到自豪,更讓人驕傲的是,阿拉伯世界性能最強(qiáng)的大語言模型在阿聯(lián)酋打造!盕aisal Al Bannai閣下在阿布扎比Make it in the Emirates活動(dòng)中表示。在談到Falcon-H1時(shí),他說:“今天,人工智能的領(lǐng)導(dǎo)地位不是為了規(guī)模而規(guī)模,而是要讓強(qiáng)大的工具變得有用、可用和通用。Falcon-H1體現(xiàn)了我們致力于開發(fā)對(duì)每個(gè)人都有用的人工智能,而不僅僅是為了少數(shù)人!
Falcon-H1仍將支持歐洲語言,并首次配備了支持100多種語言的可擴(kuò)展能力,這有賴于在不同數(shù)據(jù)集上訓(xùn)練的多語言分詞器。
更智能、更簡(jiǎn)單、更包容
Falcon-H1的開發(fā)旨在滿足全球?qū)Ω咝А㈧`活、易用的人工智能系統(tǒng)與日俱增的需求。Falcon-H1的“H”因其混合架構(gòu)而得名,該架構(gòu)結(jié)合了Transformers和Mamba的優(yōu)勢(shì),能夠顯著提高推理速度并降低內(nèi)存消耗,同時(shí)在一系列基準(zhǔn)測(cè)試中保持高性能。
“Falcon-H1不僅是我們的一個(gè)研究里程碑,我們還將其視為一項(xiàng)工程挑戰(zhàn):如何在不做出任何妥協(xié)的情況下提供卓越的效率!盩II首席執(zhí)行官Najwa Aaraj博士表示,“該模型反映了我們致力于打造技術(shù)嚴(yán)謹(jǐn)、具有實(shí)際用途的系統(tǒng)。Falcon不僅僅是一個(gè)模型,它還是為研究人員、開發(fā)人員和創(chuàng)新人員賦能的基礎(chǔ),尤其是在資源有限但雄心不減的環(huán)境中!
Falcon-H1系列包括多種尺寸型號(hào):34B、7B、3B、1.5B、1.5B-deep和500M。這些型號(hào)為用戶提供了廣泛的性能效率比,使開發(fā)人員能夠根據(jù)自己的部署方案做出最合適的選擇。較小的型號(hào)可以部署在受限的邊緣設(shè)備上,而旗艦型號(hào)34B在復(fù)雜任務(wù)上的表現(xiàn)則優(yōu)于Meta的LlaMA和阿里巴巴的Qwen等同類競(jìng)品。
“Falcon-H1系列展示了新架構(gòu)如何為人工智能訓(xùn)練解鎖新機(jī)遇,同時(shí)也展現(xiàn)了超小型模型的潛力!盩II人工智能與數(shù)字科學(xué)研究中心首席研究員Hakim Hacid博士表示,“這從根本上改變了最小規(guī)模的可能性,使得在隱私、效率和低延遲至關(guān)重要的邊緣設(shè)備上啟用強(qiáng)大的人工智能成為可能。我們的重點(diǎn)在于在不影響能力的前提下降低復(fù)雜性!
Falcon-H1系列的每個(gè)型號(hào)都超越了兩倍于其尺寸的其他模型,為性能效率比樹立了新標(biāo)準(zhǔn)。此外,這些模型還在數(shù)學(xué)、推理、編碼、長語境理解和多語言任務(wù)方面表現(xiàn)出色。
國際影響
Falcon模型已經(jīng)開始助力現(xiàn)實(shí)世界應(yīng)用。Falcon與蓋茨基金會(huì)合作,為AgriLLM的開發(fā)提供支持,該解決方案可幫助農(nóng)民在極端氣候條件下做出更明智決策。TII的Falcon生態(tài)系統(tǒng)在全球的下載量已超過5,500萬次,被公認(rèn)為是中東地區(qū)功能最強(qiáng)大、性能最穩(wěn)定的開放式人工智能模型系列。
許多人工智能模型都專注于狹隘的消費(fèi)者用例,而TII則優(yōu)先考慮建立基礎(chǔ)模型,以滿足工業(yè)、研究和公益的苛刻需求,與此同時(shí)不影響可訪問性。這些模型旨在應(yīng)用于現(xiàn)實(shí)世界的各種場(chǎng)景,同時(shí)保持可訪問性、資源效率和對(duì)不同環(huán)境的適應(yīng)性。
Falcon所有模型皆為開源,可在Hugging Face和FalconLLM.TII.ae上憑TII Falcon License獲取,后者是基于Apache 2.0的許可證,旨在促進(jìn)負(fù)責(zé)任和合乎道德的人工智能開發(fā)。
來源: AETOSWire