世界トップのAIカンファレンスの1つであるNeurIPS 2022 HCAIワークショップペーパーに選ばれた研究の詳細をご覧ください。
-
インハチェーン、アップステージAI製品UXデザイナー
オ・ジュヒョン、アップステージデータマネージャー
チョルヨンパク、アップステージデータマネージャー
-
・AI構築におけるデータの重要性に共感し、より良くしたい方
・データ構築のパイプラインに興味がある方
-
-データセットを作成するための手順を実行するためのデータ構築パイプラインについて説明します。
- データ作成の過程で実際に遭遇する困難についてお伝えします。
- 良いデータを作成する過程で、あなたはあなたが何を考える必要があるかを知り、それをうまくやることができます。
(このアップステージの講演で取り上げるデータは非構造化データであり、非 構造化 データを構築するパイプラインについて話しています。
最近、データ品質が注目されています。モデルの重要性は見過ごされていますが、ガベージイン、ガベージアウトなどの良いデータを入れないと、MLシステムの出力は良くありません。あえて言うなら、このような重要なデータを作成するプロセスは本当に長くて緩いです。
データ構築は、モデル開発の前提として我慢しなければならないプロセスではなく、作成プロセスに携わる複数の人(アノテーター、データマネージャー、PM、MLエンジニア)の専門知識の複雑なプロセスであり、それ自体が研究価値のある分野です。
Upstageのデータマネージャーであるジュヒョンとチュルヨン、そしてUXデザイナーのインハは、OCRパックと付属のアノテーションツールの作成に多くの考えを注いだ。データは単純で客観的な情報の塊と考えるかもしれませんが、AIのデータには、プロセスへの無数の人間の関与が含まれます。システムは、データを作成する際の人々の影響を軽減または強化する方法で設計する必要がありますか?この研究は、AIのトップカンファレンスの1つであるNeurIPS 2022ワークショップの論文に選ばれました。
誰が良いデータを作り、どのようにうまくいくのですか?
冒頭からの答えは、データに対するさまざまな人々の役割と影響、そしてAIを作成するシステムでこの部分をどのように構成するかを知ることによって、優れたデータが作成されるということです。
このアップステージトークでは、データを作成するプロセスで人々が果たすさまざまな役割と影響、およびデータパイプラインの構造について説明します。
🙋🏻 ♀️ ライブ講義に参加するのに苦労していますか?心配する必要はありません!
ご登録いただいた方には、「リプレイ」リンクをお届けしますので、今すぐお申し込みください!