アップステージ、世界最高性能の生成AIモデルを構築。

LLM

2023/7/19
  • アップステージ、自作モデルハグフェイスオープンLLMリーダーボードで世界2位に登壇

  • 30Bという比較的小さなサイズでグローバルトップモデルを構築、プライベートAI市場のグローバルリーダーの可能性

  • プライベートLLMでセキュリティ、幻覚現象による企業のチャットGPT禁止令に対する最高の代替案を提示


 

(Upstage=2023/7/19) 韓国の代表的な生成AIサービスAskUpを運営するスタートアップUpstageが世界最高の生成AIモデルを作った。

アップステージ(代表キム・ソンフン)は19日、同社が開発したAIモデルがグローバルAIプラットフォームであるハグリングフェイス(HuggingFace)が運営するオープンLLM(Large Language Model : 巨大言語モデル)リーダーボードで2位を獲得したと明らかにした。

ハググフェイスは様々な言語と産業に対する巨大言語モデルを提供するグローバルAIプラットフォームで、OpenAIチャットGPT、Googleのバードなど超巨大AIモデルに匹敵する300以上の世界最高のAIモデルがハググフェイスのOpen LLMリーダーボードで競争している。毎日数十個の世界各国の代表AIモデルが更新され、激しい競争が行われるリーダーボードは、モデルの推論と常識能力だけでなく、言語理解総合能力と幻覚現象(ハルシネーション)防止など生成AI評価に必要な4つの指標の評価点数の平均で最終順位を決定する。

チャットGPTで象徴される巨大言語モデル、LLMは大量のテキストデータを学習して自然言語処理(NLP)の様々な課題を遂行できる生成AI代表モデルである。最近では、オープンAIのチャットGPT、グーグルのバード、メタのラマなどグローバルビッグテック企業の代表モデルが熱い競争を繰り広げており、1000億個のパラメータ(100B)以下のオープンLLMの競争もハギングフェイスのリーダーボードを通じて時間単位で激しく行われている。

UPSTAGEは今月初めに自社構築したモデルをHUGGINGFACEのリーダーボードに提出し、性能を評価された。その結果、アップステージのモデルはメタが本日早朝、ザッカーバーグが直接公開した「ラマ2」70Bモデルに続き、平均64.7点で2位を占めた。 これは30B(300億)パラメータモデル最高の順位で、ラマ2の半分以下のサイズで競争力のある結果を作ったものである。

特にアップステージのモデルは、比較的小さなモデルサイズにもかかわらず、生成AIの最大の問題の一つである幻覚現象防止指標では56.5点を記録し、メタの最新「ラマ2」モデルの52.8点の評価をはるかに上回る驚くべき結果を記録した。このモデルは、ラマ2を除くメタ、MSなどビッグテック企業が作ったモデルとStability AI、データブリックスなどグローバルAI/LLM代表企業のモデルを含め、最近数ヶ月間ずっと1、2位を守っていたUAE技術革新研究所の「ファルコン」モデルと最近データブリックスが13億ドル(約1兆7千億ウォン)で買収したモザイクMLのモデルなど、最高性能のAIモデルに比べて平均10%程度高い成績で2位を記録した。

特に、アップステージは独自のモデル構築に着手してから約2ヶ月で世界最高性能のAIモデルを作ったことが知られて周囲を驚かせた。アップステージは、最初の韓国語自然言語理解(NLU)評価データセットである「KLUE」を直接構築したことはもちろん、130万利用者を突破した韓国代表生成AIサービスAskUpを直接運営しながら培った韓国最高のプロンプトエンジニアリングおよびファインチューニングのノウハウを基に、Cagleと様々な国際学会論文などで証明された最高の人材がTFを組んで今回のオープンLLMモデルの開発に着手した。

特に、比較的小さいサイズである30B(300億)で規模で1位を獲得し、アップステージはオープンLLMモデルのグローバルトップの技術力を確認し、プライベートAI市場でグローバルトップに立つ可能性を示した。

65B以下の小規模LLMは、1兆を超えるパラメータを持つと言われるビッグテックの超巨大AIとは異なり、軽い規模でコスト削減効果が大きく、内部サーバーに設置及び運営が可能で、個別企業が活用するプライベートAIなど、その活用性が非常に高いことが期待されている。 これまでチャットGPTに企業内部情報を入力すると、外部に流出する可能性があるという懸念が広がり、チャットGPTの利用を制限したり、完全に阻止する企業が増えており、チャットGPT、バードなど大衆が活用する生成AIサービス、それ以降の関心が高まっている。

プライベートAIは、個々の企業が保有するデータを学習させ、内部情報の流出を防ぎ、誤った情報を生成する幻覚現象を減らすことができ、生成AI競争の新たな場として注目されている。実際にアップル、ウォルマート、アマゾン、JPモルガンなどグローバル業界を代表する企業は「チャットGPT警戒令」を出したことがある。サムスン電子も機密情報流出の可能性を理由に内部でチャットGPTのようなAIツールの使用を禁止し、独自のAI開発を表明した。

今回のアップステージが完成させた最高性能を持つ小規模AIを通じて、企業や機関は情報流出の心配なく、生成AIを独自に構築して活用することができる。例えば、企業の内部規定や情報などを学習させ、企業従業員が会社内部の情報に対する答えを簡単に知ることができるAIを構築することはもちろん、財務データを活用して売上の流れを分析し、適切なマーケティング戦略をAIが提案するなどの多様な業務遂行も可能になる見通しだ。

Upstageはさらに、韓国の様々な産業の企業のニーズに応えるため、韓国語性能を高めるために韓国語データを追加学習させる予定です。

アップステージのキム・ソンフン代表は、「アップステージのAI技術力が現在最も激しい競争を繰り広げている生成AIグローバルトッププラットフォームの評価でも世界最高の成績を収め、とてもうれしい」とし、「今回実証されたアップステージの技術力を基に、国内企業はもちろん、世界中のすべての企業がAIを便利に使えるように努力していく」と述べた。

 
 
 

写真説明:韓国代表生成AIサービスAskUpを運営するスタートアップUpstageが世界最高の生成AIモデルを作った。写真はハググフェイスオープンLLMリーダーボードのランキングでアップステージのモデルが1位を獲得した様子。

 
 
  • アップステージ|キム・グンギョクPRディレクター| keunkyo@upstage.ai
    アップステージ|バ・ソンボムPRマネージャー| sungbae@upstage.ai

    プレスリリースのダウンロード

  • 2020年10月に設立したアップステージは、画像から目的の情報を抽出して利用できるOCR技術をはじめ、顧客情報と製品・サービスの特徴を考慮した推薦技術、意味ベースの検索を可能にする自然言語処理検索技術など、最新のAI技術を様々な業種にカスタマイズして簡単に適用できるノーコード・ロックコードソリューション「Upstage AI Pack」を発売し、顧客企業のAI革新を支援している。Upstage AI Packを利用すれば、データ加工、AIモデリング、指標管理を簡単に活用できるだけでなく、継続的なアップデートをサポートし、常時最新化されたAI技術を便利に使用することができる。また、AIビジネス経験を溶け込ませた実習中心の教育と堅実なAI基礎教育を通じて、AIビジネスに即座に投入できる差別化された専門人材を育成する教育コンテンツ事業にも積極的に取り組んでいる。

    アップステージはGoogle、Apple、Amazon、NVIDIA、Meta、Naverなどのグローバルビッグテック出身のメンバーを中心に、NeurPSをはじめ、ICLR、CVPR、ECCV、WWW、CHI、WSDMなど世界的権威のあるAI学会に多数の優秀論文を発表し、オンラインAI競進大会Kaggleで国内企業の中で唯一2桁の金メダルを獲得するなど、独自のAI技術リーダーシップを確立している。アップステージのキム・ソンフン代表は、香港科学技術大学教授として在職しながら、ソフトウェア工学と機械学習を融合したバグ予測、ソースコード自動生成などの研究で最高の論文賞であるACM Sigsoft Distinguished Paper Awardを4回受賞し、International Conference on Software Maintenanceで10年間最も影響力のある論文賞を受賞した世界的なAIの教祖と言われ、合計700万ビュー以上を記録した「みんなのためのディープラーニング」講師としても広く知られている。また、アップステージの共同創業者には、Naver Visual AI / OCRをリードし、世界的な成果を出したイ・ヒョルソクCTOと世界最高の翻訳機パパゴのモデルチームをリードしたパク・ウンジョンCSOが参加している。

 
先の
先の

アップステージ、チャットGPTを超え「世界最高LLM」の地位に立つ

次に
次に

アップステージ、「科技通信部・グーグル人工知能ウィーク2023」韓国代表企業として参加