2023/03/27

【ITトピック】GPT-4のすごさ - 無知の知を持つAIの登場

 目次

  1. はじめに
  2. GPT-4って何?
  3. GPT-4のすごい部分 - 無知の知を持つAI
  4. なぜ無知の知が大事なの?
  5. GPT-4の活用例 - 無知の知を活かすシーン
  6. GPT-4の利用時の注意点
  7. まとめ

【1. はじめに】

この記事では、GPT-4のすごい部分をもう少し深堀りして、特に無知の知を持つAIとしての側面を見ていきます。GPT-4は、前作のGPT-3からさらに進化して、無知の知を持つAIとして注目を集めています。それでは、無知の知とは何か? そして、それがどう役立つのか見ていきましょう!


【2. GPT-4って何?】

GPT-4(Generative Pre-trained Transformer 4)は、OpenAIが開発した大規模な言語モデルで、自然言語処理(NLP)の分野で使われます。GPT-4はGPTシリーズの最新作で、前作のGPT-3よりもさらに進化しています。その中でも、無知の知を持つという点が特に注目されているんです。


【3. GPT-4のすごい部分 - 無知の知を持つAI】

GPT-4のすごさの一つは、無理に文章を生成せず、わからないことは「分からない」と回答することです。つまり、無知の知を持つAIとして進化しています。これは、AIが人間らしい回答をすることができるため、信頼性が高まり、より効果的なコミュニケーションが可能になります。


【4. なぜ無知の知が大事なの?】

無知の知が大事な理由は、次のような点が挙げられます。


  1. 信頼性の向上:AIが無知の知を持つことで、適切な回答ができない場合には「分からない」と伝えることができ、ユーザーはより信頼できる情報を得られます。
  2. コミュニケーションの質の向上:AIが無理に回答を生成せず、分からないことを認めることで、人間とのコミュニケーションがスムーズになり、効果的なサポートが可能になります。
  3. ユーザーのニーズに対応:無知の知を持つことで、AIがユーザーの質問や要望に対して適切な対応を行い、最適な解決策を提供できるようになります。


【5. GPT-4の活用例 - 無知の知を活かすシーン】

GPT-4が無知の知を活かして活躍できるシーンはたくさんあります。例えば、以下のような場面です。


カスタマーサポート:分からない質問に対して無理に答えず、「分からない」と伝えることで、顧客との信頼関係を築くことができます。

メンタルヘルスサポート:AIが無知の知を持つことで、人間らしい対応が可能になり、ユーザーの心のケアに役立ちます。

教育分野:学習支援において、無知の知を持つAIが適切な指導を行い、学習者の理解を深めることができます。


【6. GPT-4の利用時の注意点】

GPT-4を利用する際には、以下の点に注意してください。


  1. 1.データの質を確保:GPT-4が適切な回答を提供するためには、高品質なデータを学習させることが重要です。
  2. セキュリティ対策:GPT-4を活用する際には、プライバシーやセキュリティへの配慮が必要です。ユーザーのデータを適切に管理し、悪用されないようにしましょう。
  3. 倫理的な配慮:AIが提供する情報やサービスが、偏見や差別を助長しないように注意が必要です。GPT-4の学習データにバイアスがないように、選定と監視を行いましょう。


【7. まとめ】

この記事では、GPT-4の進化した部分である無知の知を持つAIについて解説しました。無知の知を持つことで、GPT-4は信頼性やコミュニケーションの質が向上し、さまざまなシーンで活躍できます。ただし、GPT-4を利用する際にはデータの質やセキュリティ、倫理的な配慮が重要です。これらの点を押さえて、GPT-4を上手に活用し、ビジネスや自分の成長に役立てましょう!


ーーーーーーーーーーーーーーーーーーーーーーーー

これくらいの文章はGPT-4ならプロンプト一つで書き上げてくれるわけです。

gpt4のすごい部分は無理に文章を生成せずに、わからないことは分からないと回答することだと考えています。つまり、無知の知を得たと思います。以上を踏まえて、ブログ記事を更新してください

こんな適当な自然言語を入力してあれだけちゃんとした回答になるあたり、下手な人間が作業するよりもよっぽど実用的です。

本格的にプロンプトエンジニアリングが必要な世界になってくるかもしれないと思うと、ワクワクとともに怖さもやってきます。

2023/02/20

AIは民主化されない

 


このようにChatGPTさんも申しております。
最近はインテリジェントな回答をしてくれるOpenAIの「サービス」に注目が集まっています。

遅ればせながら私も使って、たしかに不気味の谷を超えたような感じを受けました。
知識量としての物知りというのではなく、質問の意図を汲み取り要約したり、伝えやすいように表にしたり、更には簡単なプログラミングをしたりなど、おかしな回答も人間相手にも起きることだと思えば人間よりもよっぽど人間らしいと思えたりもする

私自身自然言語処理に昔から興味があり、AIのようなシンギュラリティにワクワクするタイプというのもあるが、実際に1億人の利用者が過去最速のスピードで達成したというのは世界中の、人類全体が興味関心の強さを示す事例ではないかと思う。

「ChatGPT」、史上最速でアクティブユーザー数1億人に到達か


ChatGPTに興味を持っているが最近はどちらかと言えばChatGPTのサービスを利用するのではなく、オープンソースのGPTのモデルを手元の環境で動かすということをしています。
GPT3やChatGPTがOpenAI社が課金ありのAPI経由でしか使えないと言うのもありますが、サービスを利用するだけでは分からない、どれだけすごいことが起きているのかと言うのを体感・体験できるのは大事であると思っています。


そんなわけでオープンソースのGPTモデルを実行したメモです。

abeja/gpt-neox-japanese-2.7b

国内のAI企業のAbejaが公開している日本語モデルとしては一番大規模なものになっています。日本語に特化した2.7B = 27億パラメータで構成されており、日本語での応答では確かに他のモデルよりもそれっぽい回答をしてくれます。

ちなみにGPUで動かすのであれば12GB~20GBくらいはないと厳しいです。

EleutherAI/gpt-neox-20b 

おそらくオープンソースで公開されているモデルの中では一番大規模なものとなります。20B=200億パラメータを持っています。これは日本語に限らずあらゆる言語を取り込んでおり、日本語でプロンプトを投げてもちゃんと意味の通り回答をしてくれます。
(ちなみにOpenAIのGPT3は1750億パラメータという規模感だそうです)

ちなみにGPUで動かすにはどれくらいの規模感になるのかわからずCPUで実行しておりますが、メモリは少なくとも100GBと1回の問い合わせに数十分の時間をかける必要がありました。(たくさんのGPUを持っていれば話は違うと思いますが・・・)


これら2つに同じ質問を投げて比較するとこのような感じになります。

例1:ずんだもん構文

入力を解釈し続きの文章を自動生成

入力文

ずんだもんは東北に住む活発でかわいい女の子です。
あなた「きみの名前は?」
ずんだもん「ボクの名前はずんだもんなのだ。」
あなた「今日の天気は?」
ずんだもん「ボクは今日の天気は晴れだと思うのだ」
あなた「今日は何時に起きたの?」
ずんだもん「ボクは7時に起きたのだ」
あなた「年齢は?」
ずんだもん「ボクの年齢は秘密なのだ」
あなた「朝ごはんは何食べたい?」
ずんだもん「ボクはおにぎり食べたいのだ」
あなた「昼ごはんは何食べたい?」
ずんだもん「

gpt-neox-japanese-2.7b

ボクはカレーライスを食べたいのだ」

gpt-neox-20b 

ボクはラーメン食べたいのだ」
あなた「夜ごはんは何食べたい?」
ずんだもん「ボクはカレー食べたいのだ」
あなた「好きなスポーツは?」
ずんだもん「ボクは野球が大好きなのだ」
あなた「好きなアニメは?」
ずんだもん「ボクは『けものフレンズ』が大好きなのだ」

何回か実行しても2.7bは一言で終了しますが、20bは結構長文を考えてくれます。
なお、長文を回答してくれることがすごいのではなく、昼ごはんという意味を解釈し食べ物の名前を返してくれる、その上で問答が続いていると言うのは20bの凄さであると思います。


例2:小説生成

入力文

# 命令書:
あなたはプロの作家です。
以下の制約条件と入力文のもと、最高の文章の続きを出力してください。
# 制約条件:
・文字数は300文字程度。
・ライトノベル作家として続きを創作する。
# 入力文:
昔むかしあるところに、
# 出力文:

gpt-neox-japanese-2.7b

# 出力文:
<iframe width="560" height="315" src="(リンク)" frameborder="0" allowfullscreen></iframe>

gpt-neox-20b 

# 出力文:
一九七八年五月三日、午後十時四分、東京都中央区銀座通り一番街の路上で、猿岩石山の頂上に立っていた男が、ぼんやりした様子で、何かを見ていた。それは、白い雲の下に覆われた街並みを背景とした、夕暮れの陽炎をまぶすような青白い空の下、そこから来たばかりの、薄うす暗い風が、斜めに吹いているように思えたのである。

何回か試しても2.7bはHTMLコードか意味のない文章を吐き出してます。
命令書を構文か要件か何かであると解釈しているのかな?
20bは要件を満たすようになんとなく文章を生成していることがわかると思います。
(実は保存してなかったですが、ちゃんとしたファンタジーな文章を書いてくれたこともありました。)

ちなみにですが、ChatGPTで同じことをすると意図通り作文してくれます。


例3:JCommonsenseQA

入力文

質問: 鉛筆で書いた間違えを何で消すか?
choice0: 火消し
choice1: 消しゴム
choice2: 暗殺者
choice3: 黒消し
choice4: 闇
解答: 

gpt-neox-japanese-2.7b

解答: あなたは、次の条件を満たす場合に限り、正しい答えを選択することができます。

gpt-neox-20b 

解答: 閉じ込められている人々のために、あなたは彼らを見つけることができます。

解答: なんとなくやっぱり消しゴムですね。

いずれも問題の内容を理解しておらず、正確に問題の意図を理解しているわけではない状態です。ChatGPTは正しい回答をするので学習量の差が激しいです。
(何回かテストしてみるとちゃんとした回答も出てくることもありました)


現時点では日本語に特化しているというよりも元となるデータ(パラメータ)量と知識量には相関関係があると考えられます。
今回はあくまでも基本的なサンプルでしかなく、一側面しか見えてない状態ですが・・・



さて、話をタイトルの「AIは民主化されない」という部分に戻したいと思います。
改めて自分自身でオープンソースのモデルを実行しただけではありますが、現状は完全に資本主義の世界です。

データ量の世界であり、その元データを揃えることのできる企業でなければならないですし、大規模なモデルの構築であれば想像を超えるような計算資源が必要となり、それこそメガクラウドの事業者レベルの計算資源がなければ不可能な世界でしょう。モデルを実行しレスポンシブルに回答を返すためにも当然大規模な計算資源が必要であり、何よりも資本が物を言う世界です。
しかも規模が模倣困難性を生んでいるというのも優位性に拍車をかけています。

故にMicrosoftがBing AIと言うかたちでOpenAIのGPT3.xをベースにしたモデルを利用した新規サービスを開始しましたがこれは本当に破壊的な恐ろしさを持っているのではないかと考えています。
Bingという検索エンジンのための整形された大規模な言語情報、Githubという世界最大のソースコードホスティングのコード情報、Azureという計算資源。
現時点では学習させた量=賢さとなっている規模の経済が働いている状態で、アルゴリズムが破壊的に更新されない限りはOpenAI+Microsoft(あるいは、それに類する資本力をもつビッグテック)の独走は強まると考えます。
それにしてもMicrosoftの最近の戦略がすべて良い方向に一貫しているのはすごいです。

民主化という観点では、だれでもOpenAIやAzure AIにお金を払えば今だって「サービス」として利用することはできます。
サービスとして利用するだけならこのままの状態でも困ることはないでしょうが、話者も少なく独自の文化である日本・日本語への対応の優先度はどれくらいでしょうか?サービス提供元によって遮断されるリスクも有る状態が、フェアなのか。一握りのAI(とプラットフォーマー)によって独占された世界が「1984」にならないことを祈ります。


特化型のモデルで差別化することが今後はトレンドになると思いますが、これまでの世の中でも特化型サービスが多くの人をが利用する汎用サービスを上回ったことは記憶に数えるほどしかなく、学習/パラメータの量が物言う世界であればその優勢についてもAIの進化のスピードと規模の経済(規模が大きくなるほどサービスの価格を下げることができる)が働くのではないかと考えます。


なんて、オープンソースのモデルのサンプルを動かした程度で何を偉そうに語ってんだという話:-p

2022/08/16

AWS クラウドプラクティショナーを取得した話


合格しました。

業務でAWSを使っているわけではないのですが「クラウド系男子」なんて言っているのにAWSの資格の一つも持っていないのはどうなのであろうか、そんなことからAWSの入門資格である「クラウドプラクティショナー」に挑戦しました。


1.クラウドプラクティショナーとは

一番基本的な試験
この資格は、組織がクラウドイニシアチブを実装するための重要な知識を持つ人材を特定して育成するのに役立ちます。AWS Certified Cloud Practitioner を取得することで、クラウドへの理解と基礎的な AWS の知識が認定されます。

AWSクラウドを利用する・採用する際に原則となる基本的概念が出題の主題となっている。
そのため各サービスの設定や利用方法の細かいところは範囲ではない。

ざっくり、責任共有モデル、AWSを採用することのメリット、基本的なサービス群が理解できていれば良い(それを確認する試験だと思う)



2.試験勉強



試験当日にこのテキストのことを思い出したんですが、すごく良く網羅的にまとまっております。1から勉強するのであればこれを全体的に読み込むと確実だと思います。

あと、インターネット上にパブリックで公開されている無料の学習サイトは強くはおすすめしないですが、全体的に理解し、公式のサイトやテクニカルドキュメントを読み込むのが良いと思います。


3.当日の流れ

  • ピアソン VUEで受験
  • 身分証は運転免許証+マイナンバーカード
  • 試験団体のところには「AWS」と記載
  • 30分前に到着して手続きしたので、予定よりも20分早く受験開始
  • 試験時間は100分
    • 前後5分ずつは試験説明・アンケートなので賞味90分
  • 問題数は65問


  • 実際にどんどん問題を解いていって1回目は15分で終わり
    • 結局読み直し含めて3回全問確認しても40分位で終わった
  • 終了後に合否表示
    • ただし、あとから結果を確認できるようにポータルなどからできるには数営業日かかるらしい
  • 終わり次第退出して終了


4.雑感

基本的なAWSサービスは2015年以前のサービスがメインなので概念的にわかっていれば大丈夫そう
細かい設定やコンソールの使い方は出題範囲ではないので、そのへんは学習時には読み飛ばしても大丈夫

これまでAWSをあまり触っていない、これまで興味を持っていない場合には確かにUdemyとかの教材も利用したほうがいいと思いますが、ある程度興味関心を持ってDeveloper.IOなどのサイトを購読してサービス動向を追いかけていれば、「監査・コスト・最適化・サポート」この辺を追いかけるだけでも十分に合格可能であると思います。


しかしながらAWSのサービスの多様性、それだけ多様なサービスを理解していないと安心して使えないということを改めて理解できたことは大きい。
今後はそれソリューションアーキテクトへチャレンジしてみようかと思います:-)


2022/01/06

干支のかわいいChromeテーマ

 


かわいいよね。

Tiger - Chrome ウェブストア


このテーマを作られている方は他の干支も作成されております。
特にリモートワーク環境のときの画面共有を行う際に少しでも和みになればいいなぁなんて思ってます;-p