テクニカルライティングのアシスタントとしてのChatGPTの活用

経験豊富なテクニカルライターが、いくつかの執筆プロジェクトを支援するためにChatGPTを使用する方法を検討しています。彼は、ChatGPTが下書きや追加コンテンツのプロンプトを通じて時間短縮を提供できることを発見しましたが、正確さと深さに欠け、さらに楽観的な調子であるという問題点も発見しました。全体として、丁寧に作成されたプロンプトを使って小さな塊を反復的に作業する場合に役立ちます。

2023年4月25日


Photo of Mike Mason

マイク・メイソンは、Thoughtworksのグローバルテクノロジー責任者です。彼は、ソフトウェア開発に関するいくつかの書籍の著者であると同時に、アーキテクトおよび開発者として20年を過ごしました。彼はThoughtworksテクノロジーレーダーに貢献し、ソフトウェア業界のマクロトレンドに関する定期的な記事を執筆しています。


ここ数週間、私はプロフェッショナルな文脈でChatGPTの利用を模索してきました。コンサルタントとして、テクノロジーとソフトウェアに関する記事を幅広く執筆し、クライアントにアドバイスを行い、社内チームと協力しています。潜在的な知的財産の問題を回避するために、上司と社内弁護士に相談しました。特に、クライアント関連の文脈でChatGPTを使用することを避けました。代わりに、ChatGPTを公表目的のテクニカルライティングに使用することに焦点を当て、AIに機密情報を誤って公開してしまう可能性を最小限に抑えました。

Twitterカード用の画像を含めるのが好きなので、今回は当然ながらStable Diffusionを使用しました。「人間とAIが向かい合い、高度なホログラフィックディスプレイを使って共同作業しているコンセプトアート、クローズアップ、ミッドレングスのフレーミング」(Stable Diffusion v2-1_768-ema-pruned、モデルハッシュad2a33c361、シード564306172)というプロンプトを使用しました。

目標と期待

ChatGPTをライティングアシスタントとして最初に検討したとき、いくつかの具体的な目標がありました。私が最も期待していたタスクの1つは、Thoughtworksのテクノロジーレーダー用の「ブリップ」を作成することでした。レーダーは100を超える個々のテクノロジーをカバーしており、私たちのチームはそれぞれについて詳細な議論を行いますが、それらのメモを首尾一貫した段落に翻訳するのは難しい場合があります。私はChatGPTがこのプロセスを合理化し、より効率的にしてくれることを期待していました。

ブリップに加えて、私は「テクノロジー業界におけるマクロトレンド」という記事も執筆しており、この分野で観察されるより広範なテーマとパターンを掘り下げています。ChatGPTがこの作品を形作る上で、インサイトを提供したり、コンテンツに貢献したりする役割を果たせるかどうかを知りたいと思いました。

最後に、テクノロジーレーダーをビジネスの文脈に合わせて調整し、そのハイレベルなテーマを技術者ではない読者にも理解できるようにすることを目指しています。これには、複雑な概念を単純化し、より分かりやすい形式で提示することが含まれることがよくあります。ChatGPTがこのタスクを支援し、より幅広い読者にアイデアを効果的に伝えるコンテンツを作成するのに役立つ可能性を探求したいと考えました。

レーダーブリップ:Webhooksの安易な管理 - 保留

マイク

こんにちは。「Webhooksの安易な管理」の危険性について、Thoughtworksテクノロジーレーダーのスタイルで「ブリップ」を作成するのを手伝ってください。以下のメモとディスカッションを要約してください。

リモートワークの増加に伴い、チャットコラボレーションプラットフォーム(Slack、Google Chat、Microsoft Teamsなど)の導入が進み、それに伴い「ChatOps」が普及しています。ほとんどのチャットコラボレーションプラットフォームは、メッセージや通知をチャンネルに自動送信する簡単な方法としてWebhooksを提供しており、多くの開発プラットフォームツール(CI/CDソフトウェア、監視ソフトウェアなど)は、これらのWebhooksを活用するためのファーストクラスのサポートを構築しています。しかし、これらのWebhooksをシークレット/クレデンシャルとしてではなく、構成として扱う傾向があります。私たちはこの傾向が、チャットツールがWebhooksを提示する方法、チームがWebhooksをどのように扱い、保存するか(例えば、プレーンテキストでリポジトリにコミットするなど)、統合ツールがWebhooksをどのように扱うか(例えば、プレーンテキストで公開するなど)に表れていることを確認しています。これは、組織をフィッシング攻撃にさらす可能性のあるセキュリティ上の問題です。

ChatOpsのWebhooksはクレデンシャルです。内部スペースへの特権アクセスを提供します。場合によっては、直接抽出して利用できるAPIキーが含まれています。それらをシークレットとして扱わないと、フィッシングに使用される可能性があり、このタイプの攻撃に対する認識が不足しているため、フィッシングが成功する可能性が高まります。gitリポジトリ内のWebhooksは、簡単に抽出して悪意のあるペイロードを作成して送信するために使用できます。ユーザーはそれを疑う理由がなく、認証する方法もありません。この種の事例に関する重大なインシデントは、今のところ報告されていません。これは、現状への甘さを増大させているだけです。この脅威を軽減するためには、これらのWebhooksを処理するチームの文化と、ChatOpsプラットフォームとの統合を構築するソフトウェア開発者の文化の両方に変化が必要です。

ChatGPT

Thoughtworksテクノロジーレーダーのスタイルのブリップを以下に示します。

Webhooksの安易な管理の危険性:セキュリティ上の問題

リモートワークが拡大し続けるにつれて、チャットコラボレーションプラットフォームとChatOpsの導入も増えています。これらのプラットフォームは、メッセージや通知を自動送信する簡単な方法としてWebhooksを提供することがよくありますが、Webhooksをシークレット/クレデンシャルとしてではなく、構成として扱う懸念すべき傾向が見られます。これにより、フィッシング攻撃や内部スペースの侵害につながる可能性があります。

Webhooksは、内部スペースへの特権アクセスを提供するクレデンシャルであり、簡単に抽出して直接利用できるAPIキーが含まれている場合があります。それらをシークレットとして扱わないと、フィッシング攻撃が成功する可能性が開かれます。gitリポジトリ内のWebhooksは、簡単に抽出して悪意のあるペイロードを送信するために使用できます。ユーザーにはそれを認証する方法がない可能性があります。

この脅威を軽減するために、Webhooksを処理するチームは文化を変え、Webhooksを機密性の高いクレデンシャルとして扱う必要があります。ChatOpsプラットフォームとの統合を構築するソフトウェア開発者も、このリスクを認識し、Webhooksが適切なセキュリティ対策で処理されるようにする必要があります。事態が発生してから対応するのではなく、今すぐ対策を講じましょう。

考察

この出力はかなり優れていました。特に、ChatOpsの台頭を正当化し、Webhooksがどのように関連しているかを説明する最初の段落は優れていました。最後の段落は「行動喚起」のようなもので、レーダーのブリップには適切ではありませんでしたが、削除するのは簡単でした。Thoughtworksは10年以上テクノロジーレーダーを発行しているので、「Thoughtworksテクノロジーレーダーのスタイルで」出力を要求するだけで、レーダーのブリップに適した種類のスタイルを持つテキストが生成されます。別のスタイルのものが欲しかった場合は、プロンプトでより具体的に指定する必要がありました。編集後、会社全体のフィードバックを含めた結果、最終的にどのようなテキストになったかは、レーダーサイトのWebhooksの安易な管理のテキストをご覧ください。

レーダーブリップ:Giskard - 評価

Thoughtworksテクノロジーレーダーのスタイルで、「Giskard」の「ブリップ」を記述してください。以下のメモを組み込み、結果として得られる記述を2つの段落にまとめます。

Giskardは、AIモデルの品質保証です。例えば、バイアスを見つけるのに役立ちます。

理由

新しい種類のツールのようで、データサイエンティストとビジネスステークホルダー/SMEの間のコラボレーションを容易にします。まだこのツールを使用した経験はありません。

担当者A:私が話した人々は品質保証の部分を強調しており、さまざまなテストを作成できます。

担当者B:「なぜ」はウェブサイトからコピーされたものですが、コラボレーションを容易にしているのは実際には何ですか?

担当者C:モデルについて推論するとき、多くのビジネス上の意味合いが関係しているので、バイアス回避はモデルの品質指標になる可能性があります。ビジネスとともにモデルの受け入れ基準をコード化できます。

これは、他のツールと比較してデータ品質に最も焦点を当てています。

Giskardは、AIモデル向けの新しい品質保証ソリューションとして登場し、特にバイアスを特定および軽減するように設計されています。データ品質に焦点を当てることで、Giskardは市場の他のツールとは一線を画しています。データサイエンティストとビジネスステークホルダー間のコラボレーションを促進し、バイアス回避やその他の重要な品質指標に基づいてAIモデルの受け入れ基準を共同で確立できるようにします。これにより、モデルの結果がビジネス目標により良く合致するだけでなく、偏った予測に関連するリスクも最小限に抑えられます。

Giskardの実践的な経験は限られていますが、ユーザーとの会話では、品質保証のための幅広いテストをサポートする能力が強調されています。このツールの独自の価値提案は、技術的な利害関係者と非技術的な利害関係者の間のシームレスなコラボレーションを促進し、モデルとそのビジネスへの影響について推論しやすくすることにあります。チームが基準をコード化できるようにすることで、Giskardは透明性を促進し、開発プロセスを合理化し、組織がより堅牢で倫理的なAIモデルを構築するのに役立ちます。

考察

このテキストは、レーダーの「評価」ブリップにしては明らかに楽観的すぎます。ChatGPTがインターネット上の多くのマーケティングページでトレーニングされ、人間のフィードバックを使用して微調整されているという事実から、ボットが通常は言わないことを言ってしまうようになっています。「新しい」や「独自の」のような言葉は編集して削除します。

しかし、ここで非常に興味深かったのは、フィンランドの機械学習専門家からの反応でした。彼女は、このブリップは、典型的なMLワークフローをほとんど理解していないジュニアの人が書いたように聞こえ、ブリップテキストが公開できるようになる前に、かなり大きな変更を加えました。私はこの特定のツールの専門家ではありませんが(いくつかのMLツールチェーンを使用したことはありますが)、この批判的なフィードバックは、ChatGPTの出力には一般的に、レビューと編集を行うために非常に熟練した専門家が必要であることを強調しています。人間のレビューと編集後のレーダー上のGiskardブリップはこちらです。

マクロトレンドに関する記事

私はThoughtworksの「マクロトレンド」シリーズの記事の著者です。それらに精通していますか?それらが何についてのものかを教えてもらえますか?

AI言語モデルとして、Thoughtworksの「マクロトレンド」シリーズの記事を含む、幅広いトピックに精通しています。このシリーズは、テクノロジー、ビジネス、社会を形作る重要なマクロレベルのトレンドを特定し、分析することを目的としています。これらのトレンドは、多くの場合、世界的な影響を与え、技術の進歩、消費者の行動の変化、経済の変化、および世界的な出来事などの要因によって推進されます。これらのマクロトレンドを理解することで、組織や個人は変化により良く適応し、新たな機会を活用できます。

これらの記事で取り上げられる主なトピックには、以下が含まれる可能性があります(ただし、これらに限定されません)。

人工知能と機械学習の台頭

データプライバシーとセキュリティの重要性の高まり

企業におけるデジタルトランスフォーメーションの役割

気候変動と持続可能性の取り組みの拡大

モノのインターネット(IoT)と接続されたデバイスの拡大

労働力の進化と将来の仕事

ブロックチェーンや量子コンピューティングなどの新しいテクノロジーの開発

各記事の詳細は、執筆された時期と、その時点で関連するトレンドによって異なる場合があります。

はい、理解できたと思います。ただし、実際には社会に関するものではなく、テクノロジー業界に焦点を当てていると言えます。

新しい記事のために、最近のトレンドについていくつかメモを取りました。このメモを基に、マクロトレンドに関する記事のセクションとして表現するのを手伝っていただきたいのです。

最初のトレンドは、チーム向けのナレッジマネジメントに関するものです。LogseqとObsidianという興味深いツールについて議論し、それらに関する短い記事を書きました。Logseqについては、次のように書きました。

チームのナレッジマネジメントは、情報を保存したり、新しいチームメンバーをオンボーディングしたりするために、Wikiなどのツールを使用するチームにとって馴染みのある概念です。私たちのチームの中には、チームのナレッジベースとしてLogseqを使用することを好むものも出てきました。オープンソースのナレッジマネジメントシステムであるLogseqは、グラフデータベースを搭載しており、ユーザーが思考、メモ、アイデアを整理するのに役立ち、Gitベースのストレージを使用してチームでの利用に適応できます。Logseqを使用すると、チームは民主的でアクセスしやすいナレッジベースを構築でき、各メンバーにパーソナライズされた学習ジャーニーを提供し、効率的なオンボーディングを促進します。ただし、他のナレッジマネジメントツールと同様に、情報過多や混乱を避けるためには、ナレッジベースの適切なキュレーションと管理を行う必要があります。

Obsidianのようなツールでも同様の機能が利用可能ですが、Logseqの主な違いは、コンサンプション(消費)に重点を置いている点です。段落ベースのリンクにより、チームメンバーは記事全体を読む必要がなく、関連するコンテキストをすばやく見つけることができます。

これを、チーム向けのナレッジマネジメントツールに関するマクロトレンド記事のセクションにまとめることはできますか?3段落程度でお願いします。

新しいトレンド:次世代チーム向けナレッジマネジメントツール

今日のペースの速いテクノロジー環境では、チームが競争力を維持し、機敏に対応するためには、効果的なナレッジマネジメントがこれまで以上に重要になっています。従来はWikiなどのツールが情報を保存および共有するために一般的に使用されてきましたが、最近では、より高度で汎用性の高いナレッジマネジメントシステムへの関心が高まっています。LogseqやObsidianなどの新しいツールは、チームが集合的な知識を管理、アクセス、活用する方法を変革する革新的な機能を提供しています。

オープンソースのナレッジマネジメントシステムであるLogseqは、この変化の代表的な例です。グラフデータベースを搭載しており、ユーザーが思考、メモ、アイデアを整理するのに役立ち、Gitベースのストレージを使用してチームでの利用に適応できます。Logseq独自ののアプローチにより、チームは民主的でアクセスしやすいナレッジベースを構築でき、各メンバーにパーソナライズされた学習ジャーニーを提供し、効率的なオンボーディングを促進します。段落ベースのリンク機能により、チームメンバーは記事全体を読む必要がなく、関連するコンテキストをすばやく見つけることができるため、コンサンプション(消費)に重点を置いていることがわかります。ただし、他のナレッジマネジメントツールと同様に、情報過多や混乱を避けるためには、適切なキュレーションと管理を行う必要があります。

同様に、Obsidianも堅牢なナレッジマネジメント機能を提供していますが、コンテンツ作成に重点を置いています。両方のツールとも情報の管理とアクセスに役立つ機能を提供していますが、その違いは、チームのナレッジマネジメントの進化の性質を浮き彫りにしています。これらのツールが開発と普及を続けるにつれて、チームが共同作業や学習を行う方法を再定義し、最終的にテクノロジー業界におけるイノベーションと生産性を推進することが期待されます。

考察

ChatGPTが作成したRadar blipと同様に、このテキストは過度に「陽気」です。「これまで以上に重要」のようなフレーズは、少し誇張されているように聞こえます。これは一般的なテーマであることに気づきました。ChatGPTは過度に楽観的でハッピーな響きになりがちで、このため、少し「ありきたり」な内容になってしまうのです。しかし、簡単な編集で修正し、このトレンドを実際に表現するような言葉を入れることができます。

さらに、ChatGPTは常に、導入、情報、要約として回答を構成しているようです。オープンエンドな質問をしても、記事のセクションを作成するのを手伝ってもらっている場合でも、同じように構成しているように見えます。ChatGPTの出力の冒頭と最後の段落を繰り返し破棄または凝縮する必要があることに気づきました。

Thoughtworksのウェブサイトで、完成したマクロトレンド記事を見ることができます。

技術者ではない読者向けにレーダーを適合させる

技術的な文脈で語られるいくつかのストーリーを、技術的な知識が少ないビジネスオーディエンス向けに書き直す必要があります。

アクセシビリティは、長年にわたり組織にとって重要な考慮事項でした。最近、開発におけるアクセシビリティを向上させるツールやテクニックのセットが拡大していること、また、複数の地域でチームが意識向上キャンペーンを通じてこれらのテクニックの認知度を高めていることを強調しました。継続的インテグレーションパイプラインの開発、[デザインプレイブック](/radar/techniques/accessibility-annotations-in-designs)、[インテリジェントガイド付きアクセシビリティテスト](/radar/techniques/intelligent-guided-accessibility-tests)、[linting](/radar/tools/axe-linter)、[ユニットテスト](/radar/tools/ibm-equal-access-accessibility-checker)に関するアクセシビリティ関連の短い記事を掲載しました。この重要なトピックに対する意識が高まっていることは歓迎すべきことです。より多くの人々が機能にアクセスできるようにするテクニックは、良いことしかありません。

これを「それは何か」(1〜2文)と「ビジネスコンテキスト」(1段落)の形式で書き直すことはできますか?

それは何か?

アクセシビリティは組織にとってますます重要になっており、開発プロセスでアクセシビリティを向上させるためのツールやテクニックのセットが増え、その重要性を促進する意識向上キャンペーンが実施されています。

ビジネスコンテキスト

企業がアクセシビリティを優先するにつれて、製品やサービスをより包括的にするためのさまざまなツールやテクニックを採用しています。これらには、継続的インテグレーションパイプラインの開発、デザインプレイブック、インテリジェントガイド付きアクセシビリティテスト、linting、ユニットテストが含まれます。アクセシビリティを重視することは、より幅広いユーザー層に利益をもたらすだけでなく、社会的責任と包括性を重視する企業としての評判を高め、最終的には組織と顧客の両方にポジティブな成果をもたらします。

「アクセシビリティ」を1文で説明できますか?

アクセシビリティとは、障害を持つ人々が製品、サービス、環境を効果的かつ容易にアクセス、使用、操作できるようにするための設計のことです。

これを基に、アクセシビリティに関して企業にどのようなアドバイスをしますか?

企業は、障害を持つ人々にとって包括的で使いやすい製品、サービス、環境を設計および適応させることによってアクセシビリティを優先し、それによって社会的責任を果たし、評判を高め、より幅広い顧客層にリーチする必要があります。

考察

この出力には非常に満足しています。ChatGPTは、レーダーのテーマの「ビジネス向け」バージョンを非常にうまく提供してくれ、間違いなく時間を節約できました。生成されたアドバイスも非常に良いと思いました。

テクニカルライティングにおけるChatGPTの強みと弱み

全体として、ChatGPTは技術文書作成プロセスで有用なツールであることが証明されましたが、欠点がないわけではありません。その強みと弱みを理解することで、最大限に活用することができます。

強み

  • 知識: ChatGPTは、類似の状況、事実、および他者が主題について議論した方法を即座に思い出すことに優れています。これにより、目の前のトピックに関連する可能性のある追加のポイントを提起し、著者としてより多くの記述や関連情報の追加を促すことができます。
  • 時間節約: ChatGPTからの出力は、執筆の良い出発点となり、洗練または拡張できる初期コンテンツを提供することで時間を節約できます。
  • 追加の提案: ChatGPTは、追加のコンテンツやセクションの提案をすることができ、それらは一般的に非常に役立ちます。この記事のアウトラインを入力したところ、「目標と期待」と「ChatGPTの出力を改善するための戦略」を追加のセクションとして提案してきましたが、どちらも気に入って執筆プロセスに含めました。

弱み

  • 正確さと深さ: ChatGPTの応答は必ずしも正確または詳細であるとは限らず、手動でのレビューと修正が必要です。また、「情報カットオフ」日があり、最近の出来事や更新は出力に反映されません。
  • 過度に肯定的で楽観的: AIは、批判的な視点が必要な場合(テクノロジーレーダーの短い記事など)には適切ではない可能性のある、過度に肯定的で楽観的なコンテンツを作成する傾向があります。
  • コンテキストの制限: GPT-3.5とGPT-4にはコンテキストの制限があり、GPT-4の方が大幅に大きな制限があります。この制約により、ChatGPTが最新の出力のみを考慮したり、プロセスの初期のコンテキストを忘れたりする問題につながる可能性があります。
  • アンカリング: ChatGPTは、ローカルの最大値で「行き詰まる」または「固定される」ことがあります。たとえば、箇条書きのメモを複数段落の記事に展開するように要求したところ、うまくいきました。出力にはさらに詳細が必要だと思い、書いた内容を詳しく説明するように要求しましたが、実際には要求したように詳細を追加することなく、基本的に同じ内容を再度生成しました。このような場合、この問題を克服するために、これまでの最良の出力を利用して新しいチャットを開始する必要があるかもしれません。

ChatGPTの出力を改善するための戦略

ChatGPTは役立つ技術文書作成アシスタントになる可能性がありますが、出力の質は使用方法に大きく依存します。ChatGPTの応答を洗練させるためのヒントを次に示します。

  • コンテキスト設定プロンプトを使用する: ライティングスタイル、コンテキスト、対象読者を概説するコンテキスト設定プロンプトを作成、調整、再利用します。これにより、複数のチャットセッションにまたがって作業を分割する必要がある場合でも、後続のコンテンツが一貫したトーンを持ち、要件に合わせて調整されるようになります。
  • 反復的に作業する: 人間のライターと協力するのと同じように、ChatGPTが最初からすべてを正しく行うとは限らないことを覚えておくことが重要です。辛抱強く、AIを正しい方向に導き、反復を通して出力を洗練させてください。特定の指示が役立つことがわかった場合は、コンテキスト設定プロンプトに組み込んでください。
  • 小さいコンテンツに焦点を当てる: GPT-3.5は、記事の個々のセクションなど、小さいコンテンツの方が適しています。GPT-4はより長いコンテンツを処理するのに優れていますが、通常、AIとの個別の会話を使用してアウトラインを作成し、次に主要なセクションを個別に処理することをお勧めします。
  • 協調的なアプローチを使用する: ChatGPTを、部下ではなく、貴重な同僚として扱います。大規模言語モデルは、ユーザーの見かけのレベルに応じて応答する傾向があるため、プロフェッショナルなプロンプトを提供すると、プロフェッショナルな出力が得られる可能性が高くなります。

AI生成コンテンツへの過度な依存を避ける

また、ChatGPTをコーディング目的でも実験しており、特に新しいテクノロジースタックを学ぶのに役立てています(これについては今後の記事で取り上げる予定です)。数回、GPT-4はセッション中にダウンタイムが発生し、少し途方に暮れました。私のAI「コンパニオン」が突然消えてしまったのです!GPT-3.5はまだオンラインでしたが、それほど優れていませんでした。GPT-4を使用する方がはるかに好きでした。これは、これらのAIツールに驚くほど依存しやすくなっているという事実を浮き彫りにしています。批判的な視点を維持し、高品質の出力を保証するためのヒントを次に示します。

  • AIが生成したコンテンツの評価:AIの出力は常に正確性と関連性を精査してください。コンテンツに同意できるか、事実誤認がないか、あるいはあなたが支持しない可能性のある影響がないかを検討してください。
  • 欠けているものを特定する:もしあなたが自分で文章を書いていたとしたら、加えたであろうニュアンスや具体的なポイントが欠けていないか、出力を分析してください。一見完成した文章ができあがると、これらのギャップを見つけるのは難しいかもしれませんが、作品の品質を維持するためには不可欠なステップです。
  • 十分な時間をかける:ChatGPTの出力を批判的に編集するには時間がかかることを覚えておいてください。「AIによる生産性向上」は、当初考えていたほど大きくないかもしれません。必要な労力をかけることができない場合、コンテンツはあなたの基準を満たさない可能性があります。
  • 責任を持つ:最終的には、記事はあなたのコンテンツであり、あなたの名前が載ることを忘れないでください。ChatGPTを有用なツールとして扱い、最終的な出力に対するあなたの責任を忘れないようにしてください。

文章作成アシスタントとしてのChatGPTを使った私の実験は成功だったと言えるでしょう。全体的に時間が節約できたとは思っていませんが、AIの出力を出発点として使うことで、着実に進捗させることができました。LLM(大規模言語モデル)をこのようなスタイルで、つまり最初の草案を作成し、追加を提案するために使うことは、物語の執筆から受け入れテスト、ドキュメント作成まで、ソフトウェアの世界におけるさまざまなタスクで有効だと考えています。AIが私たちの仕事を奪いに来るとは思っていません。出力に対して作業する人間の専門家は依然として必要です。しかし、これらの種類のツールが人間がより高品質な結果を生み出すのに役立つと期待しています。AIツールを効果的に活用することは、今この瞬間から、知識労働者にとって重要なスキルとなっています。


大幅な修正

2023年4月25日:公開