世界トップクラスの国際社会でOCR技術を実証

2022/07/11

  • アップステージ、世界で最も権威のあるコンピュータビジョン学会であるECCV 2022で発表された2つの論文

  • マルチモーダル・テクノロジーを活用して言語要素と視覚要素の両方を一度に認識し、最高性能のOCRを実現

  • スタートアップはわずか21年、グローバルAIトップソサエティ論文が韓国で出版されました トップ5...今年、研究業績は半年で倍増


欧州コンピュータビジョン会議(ECCV)2022

(Upstage=7/11/2022) 韓国の大手AIスタートアップであるUpstageは、世界で最も権威のあるコンピュータビジョンに関する国際会議で、そのOCR技術を実証した論文を発表しました。


Upstage(キム・ソンフン代表、 www.upstage.ai)は3月11日、欧州コンピュータビジョン会議(ECCV)2022で2つの論文を発表したと発表した。ECCVは、International Society for Expressive Learning(ICLR)およびInternational Congress on Computer Vision and Pattern Recognition (CVPR)とともに、世界で最も権威のあるAI社会の1つと考えられています。


ECCVソサエティは、2年サイクルで開催される論文採択率が30%未満のトップクラスの社会であり、2020年のECCV 2020では合計5,150件の論文が提出され、そのうち採択された論文は1,360件(26%)に過ぎませんでした。その結果、Upstageは今年のトップAIカンファレンスの3つすべてで論文を発表し、トップAIテクノロジー企業であることを再確認しました。

Upstageが発表した2つの論文は、光学式文字読み取り(OCR)文字認識モデルと機械学習の基礎となる学習戦略の研究です。

第1弾論文では、写真中の文字を認識する際にAIが言語的要素と視覚的要素の両方を一度に認識するマルチモーダル技術を適用し、視覚要素を主体とする既存の文字認識モデルに比べて高い性能を実現しました。2つ目は、事前トレーニング済みのモデルを活用して特定のフィールドを適用するときに発生する問題を解決するカスタム学習戦略に関する研究論文であり、この技術をさまざまな種類のモデルに簡単に適用して、モデルトレーニング時に探索されなかったフィールドデータのパフォーマンスを確保できます。


すなわち、AIが写真中のデータを認識したときに視覚的・言語的要素が相互に相互作用するように設計することでパフォーマンスを向上させ、各種文書など様々な分野で活用する際に良好な性能を発揮する技術を示した本稿の成果は、特にOCR性能の向上に大きく貢献することが期待されます。

アップステージは、論文で認められた技術的卓越性をもとに、AIを活用して画像から必要な情報を抽出して活用する「アップステージOCRパック」の開発をさらに加速させる計画だ。

論文が発表される今年のECCVは、10月23日から27日までイスラエルのテルアビブで開催されます。Upstageの論文のうち2つは、研究トラックで専門的に公開されています。

アップステージは、英国のインペリアル・カレッジ・ロンドンが実施した「2021年グローバルAIトップティア・ソサエティ・ペーパーズ」調査で注目を集め、サムスン、ネイバー、カカオ、LGに次ぐ唯一のスタートアップとして国内トップ5にランクインしました。特に今年は、昨年の主要学会発表論文の3本をわずか半年で倍増させた6本の論文の実績を記録し、さらに大きな成果をあげることを楽しみにしています。

アップステージのキム・ソンフン社長は「世界で最も権威のある社会であるECCVソサエティが2つの論文を採択し、アップステージのAI技術能力が国際的に認められたことをうれしく思う」と述べ、「学術研究だけでなく、最高性能のサービスを生み出すための主要な基盤として使用することで、最高性能のAIをビジネスにおけるノーコードとして使用するために最善を尽くします。

アップステージは、ECCV 2022などのAI技術における実績のあるリーダーシップ、NeurlPS、ICLR、CVPR、WWW、などの国際AI会議で発表された論文、およびKaggleでの2桁の金メダルの達成に基づいて、最新のAI技術をさまざまな業界に簡単に適用できるコード不要のROCODEソリューションである「Upstage AI Pack」を今年後半に発売します。

アップステージは、「AIパック」を通じて、OCR技術、顧客情報や商品・サービス特性を考慮したレコメンデーション技術、意味に基づく検索を可能にする自然言語処理検索技術など、3つのAI技術を同時にご利用いただけるよう支援します。「Upstage AI Pack」は、データ処理、AIモデリング、インジケータ管理の活用を容易にするだけでなく、継続的な更新をサポートし、常に最新のAIテクノロジーを簡単に使用できるようにします。

 

ECCVが採用したアップステージの「マルチモーダル文字認識システム」に関する論文

 
 

 

お 問い合わせ

アップステージ| キム・グンギョ PRディレクター | 010-8229-7240 |分 keunkyo@upstage.ai

  • 2020年10月に設立されたUpstageは、企業の問題においてAIテクノロジーを通じてイノベーションが可能な場所を特定し、それに必要な基本的なAIモデルとシステムの構築を含むコンサルティングを提供します。また、お客様企業におけるAI人材の育成を支援し、企業が自社のAI競争力向上を通じてAIトランスフォーメーションを成功させるお手伝いをします。さらに、AIビジネス経験を融合させたハンズオントレーニングとしっかりしたAI基礎トレーニングを通じて、AIビジネスに即結できる差別化されたプロフェッショナル人材を育成し、企業のAIチームを積極的にデザインしていきます。

    キム・ソンフン氏は、同国初の検索エンジンMaginéを開発し、奈良ビジョン株式会社を共同設立し、ウェブメールサービスKabi Mailの開発とビジネスを行っています。以来、香港医学科の教授を務め、ACM Sigsoft優秀論文賞を4回受賞し、ソフトウェア工学と機械学習を融合させたバグの予測とソースコードの自動生成に関する研究で最優秀論文賞、ソフトウェアメンテナンスに関する国際会議で10年間最も影響力のある論文賞を受賞しています。彼はまた、合計600万回以上のビューを持つすべての人のためのディープラーニングインストラクターとしても広く知られています。

    Upstageの共同設立者には、Naver Visual AI/OCRを率いたCTOのLee Talcと、世界をリードする翻訳者であるPapagoのモデルチームを率いたCSOのPark Eun-jungが含まれます。  


 
先の
先の

アップステージが「アップステージトーク」を開催し、AI OCR導入を成功させるノウハウを共有

次に
次に

UPSTAGEが「KUK」で子供たちの可能性を解き放つための推奨AIソリューションを提供