Upstage

オリジナルを見る

世界トップクラスの国際社会でOCR技術を実証

2022/07/11

  • アップステージ、世界で最も権威のあるコンピュータビジョン学会であるECCV 2022で発表された2つの論文

  • マルチモーダル・テクノロジーを活用して言語要素と視覚要素の両方を一度に認識し、最高性能のOCRを実現

  • スタートアップはわずか21年、グローバルAIトップソサエティ論文が韓国で出版されました トップ5...今年、研究業績は半年で倍増


欧州コンピュータビジョン会議(ECCV)2022

(Upstage=7/11/2022) 韓国の大手AIスタートアップであるUpstageは、世界で最も権威のあるコンピュータビジョンに関する国際会議で、そのOCR技術を実証した論文を発表しました。


Upstage(キム・ソンフン代表、 www.upstage.ai)は3月11日、欧州コンピュータビジョン会議(ECCV)2022で2つの論文を発表したと発表した。ECCVは、International Society for Expressive Learning(ICLR)およびInternational Congress on Computer Vision and Pattern Recognition (CVPR)とともに、世界で最も権威のあるAI社会の1つと考えられています。


ECCVソサエティは、2年サイクルで開催される論文採択率が30%未満のトップクラスの社会であり、2020年のECCV 2020では合計5,150件の論文が提出され、そのうち採択された論文は1,360件(26%)に過ぎませんでした。その結果、Upstageは今年のトップAIカンファレンスの3つすべてで論文を発表し、トップAIテクノロジー企業であることを再確認しました。

Upstageが発表した2つの論文は、光学式文字読み取り(OCR)文字認識モデルと機械学習の基礎となる学習戦略の研究です。

第1弾論文では、写真中の文字を認識する際にAIが言語的要素と視覚的要素の両方を一度に認識するマルチモーダル技術を適用し、視覚要素を主体とする既存の文字認識モデルに比べて高い性能を実現しました。2つ目は、事前トレーニング済みのモデルを活用して特定のフィールドを適用するときに発生する問題を解決するカスタム学習戦略に関する研究論文であり、この技術をさまざまな種類のモデルに簡単に適用して、モデルトレーニング時に探索されなかったフィールドデータのパフォーマンスを確保できます。


すなわち、AIが写真中のデータを認識したときに視覚的・言語的要素が相互に相互作用するように設計することでパフォーマンスを向上させ、各種文書など様々な分野で活用する際に良好な性能を発揮する技術を示した本稿の成果は、特にOCR性能の向上に大きく貢献することが期待されます。

アップステージは、論文で認められた技術的卓越性をもとに、AIを活用して画像から必要な情報を抽出して活用する「アップステージOCRパック」の開発をさらに加速させる計画だ。

論文が発表される今年のECCVは、10月23日から27日までイスラエルのテルアビブで開催されます。Upstageの論文のうち2つは、研究トラックで専門的に公開されています。

アップステージは、英国のインペリアル・カレッジ・ロンドンが実施した「2021年グローバルAIトップティア・ソサエティ・ペーパーズ」調査で注目を集め、サムスン、ネイバー、カカオ、LGに次ぐ唯一のスタートアップとして国内トップ5にランクインしました。特に今年は、昨年の主要学会発表論文の3本をわずか半年で倍増させた6本の論文の実績を記録し、さらに大きな成果をあげることを楽しみにしています。

アップステージのキム・ソンフン社長は「世界で最も権威のある社会であるECCVソサエティが2つの論文を採択し、アップステージのAI技術能力が国際的に認められたことをうれしく思う」と述べ、「学術研究だけでなく、最高性能のサービスを生み出すための主要な基盤として使用することで、最高性能のAIをビジネスにおけるノーコードとして使用するために最善を尽くします。

アップステージは、ECCV 2022などのAI技術における実績のあるリーダーシップ、NeurlPS、ICLR、CVPR、WWW、などの国際AI会議で発表された論文、およびKaggleでの2桁の金メダルの達成に基づいて、最新のAI技術をさまざまな業界に簡単に適用できるコード不要のROCODEソリューションである「Upstage AI Pack」を今年後半に発売します。

アップステージは、「AIパック」を通じて、OCR技術、顧客情報や商品・サービス特性を考慮したレコメンデーション技術、意味に基づく検索を可能にする自然言語処理検索技術など、3つのAI技術を同時にご利用いただけるよう支援します。「Upstage AI Pack」は、データ処理、AIモデリング、インジケータ管理の活用を容易にするだけでなく、継続的な更新をサポートし、常に最新のAIテクノロジーを簡単に使用できるようにします。

ECCVが採用したアップステージの「マルチモーダル文字認識システム」に関する論文


お 問い合わせ

アップステージ|キム・グンギョクPRディレクター|010-8229-7240| keunkyo@upstage.ai


←ニュースルームに戻る

この内容を元の記事で見る