はじめに
今回ご紹介するのはChatGPT4の世界について。
今やご存じの方や、利用されている人は多いかと思いますが、
まだ利用したことがない、これから利用しようかとお考えの方への参考になれば幸いです。
ちなみに今回ご紹介するGPT4を利用するには、ChatGPTの有料プラン「ChatGPT Plus」を契約する必要があります。
今回ご紹介するChatGPT4について
ChatGPT4と3の違いは、性能にあります。
- GPT3.5より高度で高性能な言語モデル
- マルチモーダルに対応
- より幅広い一般常識と問題解決能力を保有
- GPT3.5より不許可コンテンツのリクエストに応える可能性が82%低い
- GPT3.5より事実に基づいた回答を出す可能性が40%向上
米OpenAIは、先月11月6日、米サンフランシスコで開発者カンファレンス「OpenAI DevDay」を開催し、
大規模言語モデル(LLM)「GPT-4」の新世代版「GPT-4 Turbo」と、「GPT-3.5 Turbo」の更新版を発表しました。
GPT-4 Turboは、コンテキスト・ウィンドウが128kに拡大され、2023年4月までの新しい情報に対応し、
現在はAPIプレビューを通じて開発者が利用可能になっているようです。
また、同日に画像生成AI「DALL-E3」、画像を入力として受け付ける「GPT-4 Turbo with Vision」(プレビュー)、
新しいTTS(text-to-speech:音声合成)がAPIに導入され、
開発者がマルチモーダルな機能をより活用できるようになりました。
さらに、オープンソースのスピーチ認識モデルの新版「Whisper V3」をリリースしており、これも近日中にAPIに組み込まれるそうです。
なんだかAPIが盛り上がっておりますが、、
今回はブラウザで利用するGPT4についてなのでAPIの方はまたの機会に。。。
最近でも、共同創業者兼CEOであったサム・アルトマン氏の解任を11月17日に発表しましたが、
11月21日に電撃復帰を発表したりと何かと話題が絶えないですね。
どんなことができるのか
チャットに質問を入力したら、自然な言葉で返答をしてくれる。そんな誰もが知っている情報は置いておいて、
今回はGPT4にはできて、GPT3.5にできない機能についてをお話します。
マルチモーダル
マルチモーダルとは、複数の形式や手段などを表す言葉ですが、GPT4はまさにマルチモーダルな基盤モデルと呼べる存在です。
具体的にいうと、GPT4は文章だけでなく写真や画像にも対応しており、写真や画像からテキストを生成することが可能となっています。
例えば、ユーザーが送った画像データに関して、GPT4がそのデータの説明をテキストで返します。
長文の会話もやり取りできる
GPT3.5のバージョンでは扱えるテキストの長さは最大4097トークンであった一方、GPT4は3万2768トークンとなっています。
そのため、GPT4はGPT3.5と比べ長文の会話に対応できるようになっています。
ちなみにGPT-4 Turboの方はというと最大12万8000トークン。桁違いですね。
多彩なプラグインを利用できる
プラグインとは、GPT4の機能を拡張するための追加モジュールのことです。
私のイチ押しは何といってもこのプラグイン!!
特定の処理に特化した多種多様なプラグインが日々アップされています。
プラグインの活用法
私のイチ押しのプラグイン。
例えばどんなものがあるのかをいくつかご紹介しておこうと思います。
SEO.app
SEO.appは、ウェブサイトのSEO分析を行うプラグインです。
ウェブサイトのURLを入力するだけで、そのサイトのSEOスコアを評価し、改善点を提案してくれます。
※利用するにはアカウント登録が必須なので注意
WebPilot
WebPilotは、指定したURLのウェブページを訪問し、その内容を取得するプラグインです。
ウェブページの検索や要約、翻訳なども可能です。
URLの指定ができれば、Webサイトだけでなく、PDFファイルやテキストファイル、
XMLファイルなど、様々な形式の情報を読み取ることが可能です。
Visla
Vislaは動画を作るのを簡単にするためのツールです。
提供する情報(動画の内容、アイデア、トーンなど)をもとに、Vislaがプロフェッショナルな動画を自動で作ってくれます。
例えば、友達との楽しい一日や旅行、料理のレシピなどさまざまなテーマで動画を作ることができます。
Show Me
Show MeはChatGPTにグラフや図を簡単に描画する機能を与えるプラグインです。
具体的には、フローチャート、マインドマップ、シーケンス図、クラス図、ガントチャート、円グラフなどの視覚的な情報を簡単に作ることが可能です。
例えば、何かのシステムの図を作りたいときには、
それをテキストでお願いするだけで「Show Me」プラグインがそのシステムの構成図などを自動的に作ってくれます。
Noteable
簡単な指示を出すだけで、Noteableプラグインが必要な分析を行い、情報を表やグラフにしてくれます。
初心者から専門家まで、これでデータ分析が誰でも手軽にできるようになります。
DocEditor
生成した内容をそのままWordドキュメントとして出力できます。
ChatOCR
スキャンされたPDFファイルなどを容易に読み込むことができます。
さらにChatGPTと連携することでスペルや文法のチェック、そして内容の要約まで可能になるのです。
Bardeen
様々なアプリケーションとChatGPTを自動的に連携させることが可能になります。
例えば、 Gmailと連携し、メールの送受信を効率的に行うことができます。
特定のキーワードを含むメールを検索したり、新しいメールを送信するなどの操作が可能になったり、
X(旧Twitter)から特定のキーワードのツイート情報を取得し、Googleスプレッドシートに保存するなんてこともできたり。
Code Interpreter
Code Interpreterでは、Pythonコードを自動的に生成するだけでなく、
それを実行し、その結果を受けてユーザーに対してフィードバックをしてくれます。
そもそも、コードの生成を明確に要求しなくても、
「〇〇を計算して」や「このファイルを分析して」のように、あいまいな指示をするだけで、
コードが必要かどうかを自動的に判断して“よろしく”やってくれるようです。
Tabelog
仕事だけじゃない!
Tabelogは、レストランを検索できるプラグインです。
料理やエリア、予算や評価などを入力すれば、それに合ったレストランを提案してくれます。
他にも国内外の宿・ホテル・航空券を調べられる「Expedia」というプラグインもあります。
プライベートでも活躍できるプラグインも豊富にあります。
Pluginpedia
これがあればプラグイン探しに困ることはありません。
求める機能を入力するだけで、必要としているプラグインを見つけてくれます。
さらに使い方やプロンプト例も教えてくれるのです。
と、ご紹介したいプラグインはまだまだ山のようにありますし、まだ知らないプラグインだらけです。
私が今回一番お伝えしたいことは、これらのプラグインはプラグイン同士を組み合わせて利用できるということです。
テキストで指示をすればあらゆることを行ってくれる自分好みのGPTにカスタマイズすることができます。
組合せ次第でやれることは無限と言っても過言ではありません。
例えば、下記の弊社HPのURLを渡し、WebPilotで解析してもらったデータをVislaで動画を作成してみました。
- チャットにHPのURLを入力。( https://www.brainassist.com/service.html )
- 1の結果を利用して動画を作成するように指示をする。
完成した動画がこちら↓
Visla上で少しだけ編集しましたが、ほぼそのままです。
動画を作成したことがない人からしたらすごいと感じるでしょう。
分かる人からしたらそうでもないレベルと感じるでしょう。
ただ、詳細な指示を出しておけばもう少し凝ったものや、音声でナレーションも付けてくれます。
たたき台レベルとしては役に立つでしょう。
また、Visla上で編集が可能なのでそれを元にあとは人の手で仕上げることができます。
現在、私が考えているのは、アプリ開発をする際にGPT4を活用し、
開発するシステムの概要や仕様をテキストで渡して、
設計書やフローチャート、ガントチャートを作成してもらい、
その設計書、フローチャートを元にプログラムコードの生成と検証、アプリのチラシ、紹介動画を作成してもらう。
なんてことも?可能になる日は近い。。。いや、今やできると考えています。
少なくとも言語がPythonならある程度はできるはず。
そんな風に、GPT4のカスタマイズや実行させる人次第で色々な人によって色々なアイデアが浮かぶと思います。
新サービスや、業務の効率化などを考える手段としてはもう十分もなのになっていると考えています。
この記事を読みながら、アレできるんじゃないか?って浮かんだ方もいるのではないでしょうか?
それ、あとでこっそり教えてください。
おわりに
いかがでしたでしょうか。
今回はGPT4の世界についてご紹介しました。
GPTに限らずAIを用いたサービスはたくさんあります。
まずは試して理解することが大切であると思っています。
AIが得意なこと、得意でないことを理解して、
良き相棒としてうまく使いこなせるようになれるといいですね。