Upstage

オリジナルを見る

サービス指向 AI モデルでデータが重要な理由

2022/09/15

⏱ 3分 
この内容を元の記事で見る

世界をリードするAI専門家であるAndrew Ng氏は、今年の会議で、AI開発においてデータはモデルよりも重要になっていると述べ、 データ中心のAIの重要性を強調した。なぜAIはデータになるのか?

過去のコンテンツから AI技術をビジネスに導入する際に考慮すべきこと今回は、サービス指向の AI モデルを開発するために必要なプロセスと、その中でデータがどのように重要な役割を果たしているかを見ていきます。

サービス指向AIモデル開発プロセス

サービス指向AIモデル開発プロセス

実際には、顧客に提供できるサービス指向の AI モデルを開発するには、4 つの主要な手順が必要です。


1. プロジェクトのセットアップ

まず、 モデルの要件を決定する必要があります。これは、処理時間、目標精度、目標qps、サービング方法、機器仕様などの詳細な条件を設定する一種のプロジェクト設定ステップと見なすことができます。これは、開発の方向性を設定するための基礎です。


2. データ準備

次に、目標を達成するためにデータを準備する必要があります。最近では、データなしでモデルをトレーニングする方法論もありますが、これまでのところ、サービスで使用されるほとんどのaiモデルは 教師あり学習の基礎によって教えられています。 つまり、モデルをトレーニングする前に、正しい答えのデータセットが必要です。


したがって、2番目のステップは、必要なデータの種類、量、ラベル付けなどについて議論し、適切なデータセットを準備することです。


3. モデルトレーニング

3 番目のステージは、 モデリング ジョブに入るモデル トレーニング フェーズです。これはモデル トレーニング フェーズです。つまり、モデル構造について考え、トレーニングを最適化する方法を検討し、最初の手順の前半で設定した要件を満たすモデルを作成します。


4. デプロイ

モデルの要件が達成されたら、 AIモデルが適用されるサービスを起動する最後のステップを踏み出します。AI モデルをデプロイした後は、予期しない問題が発生する可能性があるため、他のソフトウェアと同様に そのパフォーマンスを監視する 必要があり、 発生した問題の解決にも取り組む必要があります。


これは、サービス指向の AI モデルを開発するための一連のプロセスです。一言で言えば、最終的に要件を満たすモデルを構築することがすべてです。しかし、先ほども述べたように、AIモデルをサービスにデプロイした後も、考えもしなかった変数が存在するため 、結局、サービス指向のAIモデルを開発するプロセス全体は、その性能を維持するために、モデルの要件を継続的に満たすプロセスです

AIモデルのパフォーマンスを維持する2つの方法(出典: https://www.deeplearning.ai/wp-content/uploads/2021/06/MLOps-From-Model-centric-to-Data-centric-AI.pdf)


サービス指向 AI モデルのパフォーマンスを維持するための 2 つのアプローチ

これらの重要なAIモデルのパフォーマンスを維持するには、いくつかの方法がありますか?主に 2 つのアプローチがあります。


  • モデル中心: モデル構造を最適化し、データをフリーズし、モデルのパフォーマンスを向上させる方法

  • データ中心: 他のコードをそのままにし、データを変更または追加するだけでモデルのパフォーマンスを向上させる方法

サービス開始時のモデル性能の達成方法


サービス開始時のモデル性能の達成方法

では、最初のリリースでモデルのパフォーマンスを達成するためのデータとモデルの重みについてはどうでしょうか。 AI モデルがサービスにリリースされる前は、データ中心とモデル中心の重要性は、それぞれ 50% ~ 50% であると見なされます。


モデル要件の設定で説明する要因 (処理時間、目標 qps、サービング方法、機器仕様) の多くは、モデルのパワーによって制御されますが、精度を確保するためには、データのパワーとモデルのパワーの両方が必要です。したがって、モデルがサービス用にリリースされるまで、これらのアプローチの両方が同じ共有を持つのが一般的です。

サービス開始後のモデル性能向上方法

サービス開始後のモデル性能向上方法

一方、サービスの開始後にモデルのパフォーマンスを向上させたい場合は、データの力に取り組みます(Data-Centricは80%以上を占めます)。

その理由は、サービス開始後、 精度面でのパフォーマンス向上が求められているからです。精度を向上させるためにモデル構造を変更すると、処理速度、qps、メモリサイズなどの要件も再検証する必要があるため、コストがかかる可能性があります。したがって、サービスの起動後、可能であれば、モデルの構造は変更されず、パフォーマンスを向上させるためのデータの力によってのみ、またはモデルのトレーニング方法を少し変更することによってのみ変更されるため、データの力は重要です。

これらのサービスで使用できるAIモデルを作成する前に、データの重要性を何度も強調することはできません。実際のビジネス上の問題を解決する過程でどのような問題に遭遇し、データでどのように解決しますか?

ビジネスの現実世界の例に興味がある場合は、金融界でのデジタルトランスフォーメーションの経験を共有するためのUpstage Talkや、後日 Upstageホームページで公開される AI Techトークを通じて、より多くの洞察を得ることができます。