<var id="ll75r"><acronym id="ll75r"><strike id="ll75r"></strike></acronym></var>
  • <table id="ll75r"></table>
      1. <input id="ll75r"><output id="ll75r"></output></input><input id="ll75r"><output id="ll75r"></output></input>
        1. <var id="ll75r"></var>
              1. 創業頭條
              2. 前沿領域
              3. AI智能
              4. 正文

              清華學霸引爆“長文本”大戰,大模型的應用前景清晰了嗎?

               2024-04-02 13:30  來源:A5專欄  我來投稿 撤稿糾錯

                域名預訂/競價,好“米”不錯過

              文 | 智能相對論

              作者 | 沈浪

              Long-LLM(長文本大模型)時代似乎來得有些突然,而引爆這場熱潮的,竟是一家由清華學霸牽頭的本土AI初創企業。

              前不久,月之暗面(Moonshot AI)公司宣布旗下對話式 AI 助理產品 Kimi 應用現已支持200萬字無損上下文輸入。

              對比去年10月份Kimi上線時僅支持的20萬字,這一波升級直接提升了10倍文本處理能力,同時也引起了強烈的市場反應,特別是在資本市場,Kimi概念股應運而生,諸如九安醫療、華策影視、中廣天擇等都受益于Kimi概念而實現了股價不同程度的漲幅。

              這些刺激更讓大模型領域徹底卷起了長文本大戰。

              01 “長文本”大戰,卷的不是字數而是財力

              阿里率先完成自家的大模型產品升級,強化長文本處理能力,免費面向大眾開放最高1000萬字的長文本處理能力。

              360則緊隨其后,宣布旗下360智腦正式內測500萬字的長文本功能,并在360AI瀏覽器開放給用戶使用。

              而百度也宣布在下個月進行版本升級,開放長文本能力,文字范圍會在200萬-500萬字。

              目前,文心一言的文本上限大致為2.8萬字。而像GPT-4Turbo-128k公布的文本范圍也不過為10萬漢字,Claude3200k上下文約16萬漢字。

              可以說,這一波熱潮直接把國內的大模型廠商一下子都拉進了百萬量級的長文本競賽,而主流廠商的入局也為這場“長文本”大戰增添了很多看頭。

              目前來看,“長文本”大戰的賽點主要呈現在兩個方面。

              一方面,是大模型的支持文本參數。類似阿里通義千問的1000萬字、360智腦的500萬字、百度文心一言的200萬-500萬字、Kimi的200萬字等等,都在極力向市場爭“彩頭”,告訴用戶自家的長文本處理能力足夠“長”。

              另一方面,是長文本處理能力的開放程度。有意思的是,Kimi是免費開放給用戶使用的,阿里通義千問的長文本處理功能也是免費的,360智腦、百度文心一言也沒有要收費的意思。——以“長文本”大戰為例,今年的大模型競爭遠比去年要“卷”得多。

              還記得去年大火的妙鴨相機,以及各式各樣的圖片生成式服務,都或多或少地通過各種形式如充值、辦會員等,要求用戶付費才能體驗。

              今年大模型領域的這把“火”燒得旺,也燒的離奇地“free”。

              為什么?

              Kimi自升級以來,就有大量用戶不斷涌入,激增的流量更是一度讓月之暗面(Moonshot AI)的服務器承受了巨大的壓力,一度陷入宕機,旗下的App和小程序都無法正常使用。

              根據月之暗面(Moonshot AI)發布的官方消息,從3.20觀測到流量異常增高后,已經進行了5次擴容工作。推理資源會持續配合流量進行擴容,以盡量承載持續增長的用戶量。

              簡單來說,用戶對長文本功能是非常有興趣的,相關的市場需求還在保持持續性的、爆炸性的增長。同時,大量的用戶涌進,不僅提高了大模型產品的知名度,更重要的是在大量用戶的基礎上通過類似于UGC的模式去探索大模型的應用,或許更能進一步推動Long-LLM(長文本大模型)的商業化進程。

              當然,在這個過程中,不可避免地就得投入大量資金,一旦商業化加速,大模型廠商就得做好“卷”財力的準備。

              阿里通義千問目前免費對所有人開放高達萬頁的文檔處理能力,如果要計算成本,按照目前最便宜的市價0.1元/頁,10000頁的文檔光解析費用就要1000元,這還不包括解析完成之后大模型處理文檔的成本??紤]到通義千問網頁、APP、釘釘等多個端口的用戶基數,需要投入的資金恐怕不會是個小數目。

              大模型的商業化在開始階段并非“賺錢”,而是“燒錢”。

              02 長文本,直接“接駁”商業化場景

              在大模型的商業化進程上,長文本的爆火是很關鍵的一環。

              就大模型的技術原理而言,解決長文本問題是必要的。因為文本長度的提高,對應的模型能解決問題的邊界也將大幅提升,兩者呈現出明顯的正向關系。

              傳統的文本處理模型受限于訓練結構,可支持的文本范圍都不算長,在處理復雜任務和深度專業知識(這一類知識往往都是長篇巨著)時,只能拆解輸入訓練,由此就有可能導致輸出的結果上下文邏輯不連貫不順暢等問題。

              區別于傳統的文本處理模型,長文本模型就具備更準確的文本理解和生成能力以及更強大的跨領域遷移能力。這對于打造垂直領域的行業專家是一個非常必要的能力支持,比如面向一些長篇巨制的醫療文獻、法律文件、財務報告等,長文本模型就具備更好的理解能力,對應完成跨領域學習和應用,從而打造出更專業的醫療助理、法律助理以及金融助理等應用。

              話不多說,實踐一下。

              在這里,「智能相對論」向阿里通義千問相繼“投喂”了幾本長達數百頁的專業書籍,涵蓋以《高產母豬飼養技術有問必答》為代表的農業養殖、以《犬貓營養需要》為代表的寵物喂養等等小眾領域。

              結果所能實現的效果確實令人驚訝,阿里通義千問不僅能高度概括總結這些長篇巨著的主要內容,還能有針對性的給出具體篇章的知識解答。比如,在《高產母豬飼養技術有問必答》一書中,「智能相對論」向其提問“夏季高溫提問應該如何飼養母豬?”很快就得到了書中的精煉解答。

              這意味著什么?只要用戶有足夠多的專業書籍“投喂”給大模型,那么大模型就可以成長為一個專業的專家助理,幫助用戶快速解答相關專業問題。

              在日常生活中,或許有很多書籍是我們沒辦法去仔細閱讀和學習的,但是只要有長文本大模型予以支持,那么基本上人人都能創造一個專業的垂直領域助理。

              這或許會顛覆現在我們獲取信息、知識的渠道,去百度搜索或是去知乎提問、亦或是去小紅書討論這些路徑都將被替代。

              在Kimi開放20萬字文本處理能力的時候,其做了一個簡單的對比,20萬字等于什么?答案是等于先秦的全部古籍。隨著長文本大模型進入百萬量級的迭代,那么這些能力還能實現進一步的進化,對應所賦予場景應用的機會就是無限的。

              如今,在AI領域,Agent的話題也很火,被認為是下一個主流的應用形態。那么,打造Agent的關鍵是什么?答案正是大模型的長文本處理能力。

              比如,Kimi就在幫助元隆雅圖等公司進行營銷升級,基于長文本處理能力來提供爆品文案分析、文案寫作、市場分析、輔助營銷策劃等功能。

              盡管現在很多相關的應用還處在探索階段,但是誰又能確定下一個爆款應用不是出自自家的大模型+某個C端用戶的想法/某個企業客戶的業務融合?正因如此,大模型廠商們才不顧一切的升級并開放長文本功能,為下一場應用上的爆火做準備。

              目前,長本文的火爆還只是技術上的,接下來的爆點大概率將是應用上的爆發。

              03 寫在最后

              2024年是大模型大規模走向商業化的關鍵一年。從Kimi的火爆程度來看,以長文本為代表的技術迭代走向C端引發了非常積極的反饋。同時,在「智能相對論」的實踐中,也預感這一能力隨著技術的成熟和完善,必然會在C端用戶的手中被“玩出花來”。

              只是目前很多的“玩法”還缺乏打磨,顯得比較粗糙。OpenAI在發布GPT商店時,就期望要打造一個全新的生態,人人都能創造自己的專屬GPTs。

              現在,擺在大眾面前的長文本熱潮,其實就是一個全民時代到來的信號。只要用戶有書,會投喂,那么同樣可以在國內的大模型平臺上打造出屬于自己想要的專業助理,進而延伸到應用端的火爆。

              當然,在這個過程中,書籍的版權問題、平臺的審核問題以及巨大的流量涌入所帶來的諸多挑戰和問題,也是大模型走向商業化的難點。但是,其根本的方向是清晰的,Long-LLM(長文本大模型)時代已經拉開序幕,從技術到應用,接下來大模型廠商們有得卷了。

              說實在,就目前各大廠商公布的參數,從500萬到1000萬,基本上也足夠用了。大模型在長文本技術層面或許不會再有什么值得卷了,哪怕是有也只是背地里正常迭代和發展。

              接下來的爆點只能是往應用層面來看。不管是To C還是To B,誰家的平臺最先把大眾化的應用探索并驗證出來,再加以打磨推向大眾市場,那么誰就有可能成為下一個市場的寵兒。

              *本文圖片均來源于網絡

              此內容為【智能相對論】原創,

              僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

              部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。

              •AI產業新媒體;

              •澎湃新聞科技榜單月度top5;

              •文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

              •著有《人工智能 十萬個為什么》

              •【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發者以及背后的芯片、算法等。

              申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!

              相關文章

              • 產業升級視角下,數字“新動能”有了正確打開方式

                文|智能相對論作者|葉遠風產業升級如火如荼,通過數字化、智能化來激發“新動能”,已經成為普遍共識。但是,作為一個泛概念,“新動能”到底是什么,又如何具體到一些舉措、動作上,才能確保落地,從而切實推動產業升級?業界需要一個關于“新動能”如何被激發的切實路線圖。事實上,針對產業升級的“新動能”,最終還是

              • 大模型“1元購”?AI公司加速奔向應用端“大航海時代”

                自字節跳動發布豆包大模型,互聯網大廠紛紛就位,擊穿“地板價”的打法從C端向B端拓展。這也成為今年“618”最亮眼的價格戰。5月15日,字節跳動率先宣布豆包大模型已通過火山引擎開放給企業客戶,大模型定價降至0.0008元/千Tokens;5月21日,阿里云宣布0.0005元可得1000tokens,百

              • 生產力工具中的“六邊形戰士”:解密海螺AI“紅海突圍”的底氣

                2023年可以說是人工智能行業最振奮的一年,大模型的能力每隔一段時間就會上一個新臺階,洶涌澎湃的技術革命迅速影響著每一個人的生活,AGI不再是一種技術理想,而是觸手可及的現實。到了2024年,人工智能的熱度不減,但口口相傳的“百模大戰”并未上演。資本市場罕見地“降溫”,不少大模型悄無聲息地消失,有機

              • 谷歌發布多模態大模型重回領先,中國大模型誰能一戰

                多模態是AI大模型發展的未來方向。

                標簽:
                谷歌
                大模型
              • 大模型“黑洞”能否逆襲成盈利“金礦”?揭秘未來走向!

                ChatGPT運行日耗70萬美金!GPT-4訓練成本破10億美金大關!OpenAI2024年財務警鐘敲響,破產風險浮現!國產大模型燒錢大戰升級!百度、科大訊飛、阿里、騰訊等巨頭已燒掉上百億資金!大模型背后的“燒錢”豪賭,誰能笑到最后?降低成本大模型成本怎么降低?有兩條比較實用的路徑大模型背后的成本確

              • 百度文心智能體有什么用、怎么創建和如何使用?

                前言:這是白楊SEO公號原創第530篇。為什么寫這個?一個星期多前在白楊流量匯群看到有人問,自己實戰測試研究了下分享給大家,也許對大家有點用。本文大綱:1、百度智能體是什么?2、百度智能體有什么用?3、百度智能體怎么創建?4、百度智能體如何用(營銷)?百度智能體是什么?百度智能體,準確的叫法應該是百

                標簽:
                百度文心
              • 通義千問GPT-4級主力模型降價97%,1塊錢200萬tokens

                C114訊5月21日消息(九九)阿里云今天拋出重磅炸彈:通義千問GPT-4級主力模型Qwen-Long,API輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%。這意味著,1塊錢可以買200萬tokens,相當于5本《新華字典》的文字量。這款模型最高支持1千萬toke

              • OpenAI發布GPT-4o 能讀取人類情緒

                近日,OpenAI宣布推出其最新旗艦生成式AI模型GPT-4o。相較于GPT-4Trubo,GPT-4o速度更快、價格也更便宜據悉,ChatGPT可以讀取人類的情緒,但讀取過程有一點困難。OpenAI,是一家位于美國舊金山的人工智能研究公司,現由營利性公司OpenAILP及非營利性母公司OpenAI

                標簽:
                chatgpt
              • ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您?

                隨著人工智能技術的飛速發展,大語言模型(LargeLanguageModels,LLMs)在各行各業的應用日益廣泛,尤其是在軟件開發、數據分析、客戶服務等領域。蘑菇云創客空間[445期開放夜]就以“ChatGPT、Gemini、通義千問等一眾大語言模型,哪家更適合您”這樣的主題,開展了一次深度的大語

              • 體驗了下釘釘AI助理,真羨慕現在的“打工人”...

                對于萬千打工人來說,AI不會替代我們,反而會成為工作中重要的幫手

                標簽:
                釘釘

              編輯推薦