ChatGPTなどのAI機能による文書生成技術は、近年めざましい進化を遂げています。一度でも利用したことがあればご存知だと思いますが、疑問や質問を投げかけると、まるで専門家が丁寧に解説してくれたかのような文章が自動的に表示されます。
大変便利で、日常生活のみならずビジネスの場でも多様な活用方法が期待できるのは想像に難くないです。その反面、AI技術が進化するのに伴い、「人間が書いたものなのか?」あるいは「AIが生成したコンテンツなのか?」見分けるのが難しくなってきました。大学の卒業論文をChatGPTに作成させて提出したら、教授は本当に生徒が自分で書いた論文か判断に迷ってしまうかもしれませんよね。そこで、AIによる文書か否かを判定する“検出ツール”が登場しているのです。
ChatGPTの検出ツールにはどんな種類があり、どうやって見分けることが可能になるのか、この記事で解説していきましょう。
AIが書いた文章を見破るツールは存在する?
AIコンテンツを検出するツールは、近年次々に開発されており、精度も向上しています。そのようなツールが、AIが書いた文章だと判断する要素について、これから説明します。
AIが生成するコンテンツには、一定のパターンが存在すると言われています。大量のデータを学習し、情報量が多く膨大なデータから最適な回答を導き出すため、似たようなパターンが生まれてしまうのです。一例として、海外の研究によると、ChatGPTが普及しはじめた2022年以降に発表された論文の中に、「複雑な」や「揺るがぬ」という単語を含む文章が急増したそうです。ChatGPTで使用される語句や文章構成に類似の傾向が見られ、判別のポイントになります。
また、学習したデータに基づいてコンテンツを作成するので、新規性や創造性に欠ける文書になりがちです。未知の領域に踏み込むことはできず、あくまで従来存在する情報、つまり第三者が提供したデータを元にせざるを得ません。専門的な深い洞察をすることも苦手だと言われています。
chatGPTの判定ツールで日本語対応のものをピックアップ
それでは、ChatGPTの検出ツールとして評判が良いものを、いくつか紹介していきたいと思います。
①GPTZero
プリンストン大学の学部生、エドワード・ティエンさんが2022年12月、ChatGPTが書いた文章を検出するツール「GPTZero」のプロトタイプを作成しました。独自のアルゴリズムやトピックモデルを評価する指標などを用いて、AIが作成したコンテンツか判定するツールをリリースしたのです。
自分と同じ学生が、ChatGPTを使って論文を作ることを見破る目的で開発したそうです。アメリカでは、日本以上にChatGPTが普及し、学生たちも使用するのが当たり前になりつつあります。「論文をAIに頼って書く人がいるはずだ」と考え、自分で判定ツールを制作してしまうのは、すごいですよね。
「GPTZero」に文章を入力すると、人間が書いた可能性が高いか、AIが書いた可能性が高いかを判断します。シンプルなテキストに限らず、PDFファイルやWordドキュメントをアップロードしても、同様に判定してくれるので非常に便利です。基本的にChatGPTで生成された文章を対象にしたツールですので、他のAIが作成した文章だと、正確性が多少低下する可能性はあります。
②コピペルナー
ソフトウェア開発会社のアンクが、文章ファイルの類似度を簡単にチェックするソフトとして開発したのが、「コピペルナー」です。「コピペルナー」を使用すると、レポートや論文などの長文コンテンツを、インターネット上のWebページや他の文書ファイルと比較して、ChatGPTを使っている可能性が高い部分を表示します。文章全体を通じて判定するのではなく、コピーアンドペーストした箇所を具体的に表示してくれるのが特徴です。
学校や官公庁、一般企業向けのツールとなり、導入には費用がかかります。大学教授などが、適切な範囲での利用か否かを判断する材料として用いることを想定しています。丸々引用したわけではないがChatGPTからの引用が明らかに多い、そんな文書を見分ける時に役立ちます。
③AI GPT3 Detector
プラットフォーム内でAIコンテンツ検出ツールを提供する先駆け的企業の一つ、Kazan SEOが提供する「AI GPT3 Detector」です。AIが書いた可能性を確率(パーセンテージ)で表示してくれます。文字数が多いほうが正確性が高まります。文字数制限がなく、AIコンテンツの最適化など判定ツール以外の機能も備えていますが、利用にあたりユーザー登録を求められます。ちょっと面倒に感じる方もいるかもしれません。
AIチェッカーは大学でも活用されている?
とある海外の調査機関によると、現在は約半数の大学生が学校の課題において、ChatGPTなどAIを使用したことがあると回答したそうです。しかし一方で、大半の学生は、AIが生成した文章をそのまま引用することがカンニングや盗用に該当するとの認識があるといいます。
今や、学生がChatGPTを使うことは珍しくありません。教授の立場からすると、生徒たちには自分の頭で考え、自分の力で論文やレポートを提出して欲しいはずです。
試験や卒業論文でAIが作成したコンテンツを検出するため、大学でも判定ツールの導入が進んでいます。専門的な知見を有する教授は、生徒が書いた文章を読めば、AIに作らせたものか見分けることは十分可能です。
とはいえ、何百人もの生徒を抱える場合、逐一疑いの目を持ちながら識別することは、負担が大きいですよね。判定ツールに文書ファイルをアップロードして判定が出れば、あとは許容範囲か否かを教授が検討するだけです。学生としては、本来なら時間を要する卒業論文をあっという間に完成させてくれるChatGPTに手を出したくなる気持ちも分かりますが、すぐにバレてしまうと認識しておくべきでしょう。
まとめ
ChatGPTに代表される文書生成技術が発展するのに伴って、それを見破るAIチェッカーも精度を高めています。教授や専門家にいわせれば、素人がAIを使って作成した文書かどうかは、読めばすぐに分かるそうです。AIが過去の論文や記事をほぼコピーしたような文書を作る場合、判定ツールはどの部分が引用であるか、引用した確率は何%か即座に判定できるようになりました。
「最近、AIが書いたような文書を提出する者が増えた」と感じている教育機関や企業関係者は、ぜひ検出ツールを取り入れているといいでしょう。