MSOL DigitalがChatGPT導入で感じた課題&実践的対応策 その①
こんにちは。MSOL Digital の大串です。
「デジタル マネジメントの変革力で未来をつくる」をブランドパーパスにしているMSOL Digital は、さまざまな産業にとってのDX エコシステム共創のベストパートナーとなるべく、デジタルとマネジメントのプロフェッショナルとして日々奔走しています。
MSOL が提供するDX の目的は、「マネジメントを効率化し、人・リーダー・マネージャーがすべき業務に注力できる環境を作る」こと。
この「マガジン」を見てくださっている皆さまも、どのように DX を推進すべきか、生成AI を活用してサービスの効率化や高度化を図れないか……など、頭を悩ませているかもしれません。
実際に、人口が減り続けている日本において、DX に期待する産業は年々増えており、導入意欲も高まっています。一方で、導入にはさまざまな課題があるのも現状です。
ここでは、そのようなDX 導入における課題解決のヒントをお届けしたい、と思っています。17 年にわたり大手ユーザー企業へのIT・DX 関連プロジェクトを支援してきたMSOL ならではの知見から、汎用的な情報はもちろん、少々マニアックなナレッジも、何かしらお役に立てることがあれば幸いです。
MSOLにおける生成AI活用事例:「 AIコンシェルジュ機能」
近年ますます注目が集まっている、生成AI について。
MSOL では、自社サービスとして皆さまに提供している「PROEVER(プロエバー)」というプロジェクトマネジメントソフトウェアに、ChatGPT(テキスト生成AI)を使った「AI コンシェルジュ機能」を2023 年6 月に追加しました。
⇒2023.06.14【ニュースリリース】PROEVERで生成AIを使ったAIコンシェルジュ機能の提供を開始。 プロジェクトマネジメントを実践している際に発生した困りごとを相談できる
以下はそのイメージです。生成AIが、プロジェクトマネジメントツールにおいて、どう活用できるか、そのイメージが少し見えてくると思います。
このAIコンシェルジュ機能の開発で得た知見から、今回は、
・ ChatGPT を導入する上で問題と感じる点
・ それらの問題について、MSOL ではどのように対応しているか
などについて、3話にわたり紹介していきます。
1話目は、そもそもChatGPT とは何か少し復習し、私たちの用途ではどのような課題が発生するか、解決策をどのように検討できるかについてお話してみます。
ChatGPTとは何か
もはや説明の必要はないかもしれませんが念のため、ChatGPT とは、テキストベースの会話を処理し、適切な返答を生成する能力に特化している言語モデルのことです。
別の言い方をすると、ChatGPT(Generative:生成可能な、Pre-trained:事前学習済みの、Transformer:変換器)は、Transformer 系のAI 技術に基づく、自然言語処理システム(NLP:Natural Language Processing)の大規模言語モデルのことです、とややマニアックにご説明することもできます。
高性能言語モデル「GPT-3」
OpenAIが2020年7月に発表した、高性能言語モデル「GPT-3」。その膨大な学習データ量は、4990億語。かかったコストの総額は460万ドル(約4億9000万円)* 。
ちなみに、米メリーランド大学の研究結果によると、男性が1日に発する単語数は平均7,000語。一方、女性の場合は平均20,000語で、男性のおよそ3倍もの単語数を発しているといいます。
GPT-3が学習した4,990億語は、人で置き換えると⇒⇒仮に1日2万語として365日で割ると、68,356年分の単語量。(一生で人が話す言葉の数は……6億語となります)
この後も、より高度になったGPT-3.5、GPT-4、さらにGPT-4 Turboが発表されていますし、各社の開発競争が激化しているのはご存じの通りです。「AIコンシェルジュ機能」では、GPT-4 Turboを利用しています。
* https://jalammar.github.io/how-gpt3-works-visualizations-animations/
ChatGPTにおける「Attention(アテンション)」の重要性
言語モデルにおける重要な概念の一つに、「Attention(注意機構)」があります。これは、言語モデルが入力データの特定の部分に「注目」する仕組みのことです。ChatGPTのキモとも言える部分なので、少し振り返っておきます。
例えば、以下の2つの文章について。
①阪神甲子園球場のライトは2022年にLED化され照明器具は756台存在する。
②阪神タイガースのライトを守っている前川右京選手は智弁高校時代に前阪神監督の金本氏から指導を受けた経験がある。
「ライト」は、英語だと “light” と “right” の2種類の単語が存在しますが、カタカナで記載したLEDの「ライト」と、野球のポジションの「ライト」は単語の前後に注目(Attention)することで、異なる意味を持つと判断できます。
しかし、Attentionは基本的には局所的な文脈に焦点を当てることを得意とするため、長い文の場合、文中の単語同士の関連性を捉えることが難しいことがあります。
また、Attentionはあくまで与えられた情報をもとに重み付けを行う仕組みであるため、特定のトピックに対する事前知識やコンセプトの理解が不足している場合、モデルが不適切な情報を生成する可能性もあります。
このAttentionの問題をどう解決するかは、ChatGPT活用において重要なキーとなっています。
MSOLがChatGPTを導入する上で感じた課題
ここからは、実際にMSOLがChatGPTを導入する上で、どのように課題に対応したかについてお伝えしていきます。
まず、「PROEVER(プロエバー)」にChatGPTを活用して「AI コンシェルジュ機能」を追加するにあたり、以下のような問題があることが分かりました。
- ChatGPT に何も前提を入れない場合、専門的な内容には正しく答えられない。
- AI ハルシネーション(AI が見る幻覚)が存在する。
- コンテンツポリシーに反した回答を行い、信用を落とす可能性がある。
- ChatGPT に問い合わせを行う度に発生する、コスト問題
- 社内ノウハウを活用して問い合わせ対応を効率化したいが、ノウハウの社外流出といったセキュリティリスクがある。
なお、最後に挙げたノウハウの社外流出リスクに対しては、OpenAIに対してオプトアウト指定で対応、またはMicrosoft Azure環境を活用することで対応することができます。なお、Google BARD は2023年6月23日時点ではオプトアウトの仕組みが無いため注意が必要です。
上記の問題について整理し、MSOLでは、対応すべき課題として以下3つのテーマを設定しました。
①正確性
②セキュリティ
③コスト削減
ChatGPT導入、3つの課題テーマと解決策の方向性
3つの課題テーマについて、それぞれ対応策を検討します。
<課題①正確性>
- ChatGPTに前提となる情報を渡して、専門的な内容に正しく答えられるようにする。
- AIハルシネーション問題対策(デタラメな回答を行わないようにする)
- APIパラメータの組み合わせパターンの研究
- シナリオ作成
<課題②セキュリティ>
- コンテンツポリシーに反した回答を行わないようにする。
- プロンプトジェイルブレイク対策(コンテンツポリシーを無視した回答をさせる手法)
<課題③コスト削減>
- トークン数の圧縮(英語化、カテゴライズされたプロンプト、ベクトル型データストアの活用)
- 同様の質問はChatGPT-APIを利用せず過去ログから出力
第2 話では、上記にあげた解決策について、実際にどのように対応していったのかを詳しく解説していきます。