次世代の生産性を実現:RPAから生成AIまでの自動化の進化と挑戦
この記事のメインポイント
-
数々の進化を遂げてきたRPAシステムだが、導入やエンドツーエンドのプロセスの自動化を実現するためにはいくつかの制約がある。
-
事前にトレーニングされたLLMモデルが、プロセスオートメーション参入の壁を劇的に下げている。
-
生成AIは、プロセスマイニング機能と自律的なコード生成を組み合わせることで、最も革新的なワークフローの発見と最適化に関する問題を解決する。
-
複数のモデルの連携と迅速なエンジニアリングにより、エンドツーエンドの完全自律駆動型エージェントを可能にする。
-
モデル強化によって、ボットは時間の経過とともに賢くなり、個々の問題解決も可能になる。
-
「あなたのポジションが、AIによって完全になくなる可能性はあるか?」もしかしたら、3月に発表されたGoldman Sachs Researchのレポートで予測された「生成AIによって完全に置き換えられるリスクのある3億の仕事」のうちの1つかもしれない。
ライターの紹介
Nick Giometti:Geodesicのバイスプレジデント 兼 投資チームメンバー。ディールソーシングや投資活動のほか、ポートフォリオ企業の支援を担当。Geodesic入社以前は、BlackRock社にシステマティック投資家として8年間在籍し、定量的社債ファンドの運用とワークフローの自動化ソフトウェアの開発に尽力。GeodesicでAIや自動化について語らせたら右に出るものはいない。
イントロダクション
あなたのポジションは、AIによって完全になくなる可能性はありますか?もしかしたら、3月に発表されたGoldman Sachs Researchのレポートで予測された「生成AIによって完全に置き換えられるリスクのある3億の仕事」のうちの1つかもしれません。
機械がすべての仕事を代行する世界が約束されたのは、今に始まったことではありません。マッキンゼーの2017年のレポートでは、2030年までに8億もの仕事が置き換えられると予測され、その主な要因はRPA(Robotic Process Automation)の急速な進歩にあるとされています。RPAは企業によって大規模に導入されてきましたが、近年は大手企業で減速しています。マッキンゼーなどによる全社的な自動化に関する思惑は外れてしまいましたが、今のLarge Language Models(LLM)が推進する、ものすごい勢いのイノベーションによって、再び大きく刺激されています。
各社は個々の生成AI製品を試し始めていますが、セキュリティ、説明の明確さ、ハルシネーション(質問を理解していないのに確信犯的に間違った答えを出すこと)などの懸念から、まだ大規模な導入には至っていません。企業がRPAとその関連ソリューションに取り組んできた長い歴史を考えると、生成AIを実戦的なソフトウェアに加えることは、信頼を得るための最適な切り札となるかもしれません。また、これまでの自動化の欠点に対処し、完全自動化企業への歩みを飛躍的に加速させる可能性も秘めています。ここでは、企業がRPAからインテリジェント・プロセス・オートメーションへとどのように進化してきたか、その進化がまだ足りない部分はどこか、そして生成AIがこれらのギャップをどのように埋める可能性があるのかについて探っていきます。
進化するエンタープライズ・オートメーション
RPAは1990年代後半から2000年代前半に登場し、低スキルでありながら高コストの繰り返し作業をコンピュータで再現、管理、代行することを促進しました。データベースシステムへの情報の同期やレポートの作成は、ボットにとっては理想的なタスクでした。それ以降、数十年の間の段階的な拡張・変化により、RPAはより複雑なタスクへの導入が容易になりました。
1.コグニティブRPA(2000年代前半)
2000年代初頭、従業員の経費報告書のデータを人事部の会計システムにリンクさせることで、一見進歩したように見えました。しかし、システムに取り込まれたデータは記録されず、ひとつのシステムから別のシステムへ移動させることもできなかったのです。このため、光学式文字認識(OCR)と呼ばれる初期のAIモデルを搭載したスクリーン・スクレイピング機能が開発されたことで、読み取られたデータは、保存され、そして次のアプリケーションに転送され、各ステップは完全に管理されていました。
RPAの最大の欠点
導入:現在のRPAの導入に関心を持つ企業は、その取り組みをコンサルタントに任せていることが多いです。システム・インテグレーション・コンサルタントは、数ヶ月かけて調整したプロセスのマップを作成し、システム間の接続を構築し、ビジネスリーダーができるだけ人の手を借りずにシステムを維持できるようにトレーニングする必要があります。コンサルタントは、どのプロセスやプロバイダーが該当のプロジェクトに最も適しているか、また、企業が持っているかどうかわからないけれども、どのような技術的リソースが必要かを判断するのに不可欠な存在です。
生成AIはどう解決する? – ジェネレーティブ・プロセス・マイニング
プロセスマイニングは、全社自動化によって価値創造までの時間を短縮しようとする企業によって既に使用されています。現状では、機械が生成したデータの世界を検証することができ、企業は生産性における最大の課題や潜在的な利益がどこにあるのかを特定することが可能です。プロセスマイニングは、アウトサイド・インの視点に頼るのではなく、破損したプロセスによって、どこで損をしているか、どこが後回しになっているかなどをデータに基づいて証明します。しかし、非効率なプロセスが特定されたとしても、それを自動化するコードを記述するために、導入コンサルタントやRPAソリューションが必要となり、価値創造までの時間はさらに長くなってしまいます。
次の重要なステップは、プロセスマイニングと大規模言語モデルを組み合わせることです。これにより、アドホックにコードスニペットを生成したり、ゼロから新しいプロセスを設計したりして、機械主導のインサイトを実現することができます。ジェネレーティブ・プロセス・マイニングは、まずユーザーの行動における非効率的なパターンを大規模に特定し、次にマッピングを最適化し、潜在的なエッジケースをまとめ、プロセスの破損を未然に防ぎつつ、重要な予防メンテナンスを可能にします。
Orby.aiのような企業は、すでにプロセスマイニング、GenAI、RPAを組み合わせて、導入コンサルタントの必要性を回避しています。Orbyは、作業者の行動を観察して、最も繰返しの多いタスクを見つけ出します。コンサルタントを雇ったり、社内の開発リソースを割り当てたりすることなく、Orbyは自動化スクリプトを設計・編成し、ありふれたプロセスをすぐに補強または置き換えることができます。
2.APIと統合プラットフォームが主流に(2010年代)
2010年代には、メタデータ管理とログがソフトウェアインフラのスタンダードになりました。これとユニバーサルAPIを組み合わせることで、アプリケーション同士の読み書きが可能になりました。Workato、Zapier、Tray.ioなどの統合プラットフォーム(IPaaS)が登場し、RPAの機能により、さらに多くの接続と多段階の自動化が促進されました。
統合プラットフォームの最大の欠点
インテリジェントルーティング:統合プラットフォームのプレイヤーによる自動化は、スコープ内のトリガー(こうなったらこうする)、プリミティブ(アクションタイプのこと。例えば、データのコピー、新規アカウントの作成、通知の送信など)、接続(プログラムがネイティブに通信できるもの)に依存しています。この方法では、予測可能な行動で再現性の高いタスクを処理することはできますが、コンテキストが変化する複雑なワークフローをマッピングするには、時間がかかり、計算コストも高くなります。予想される動作のあらゆる可能性をマッピングすることに時間を費やすよりも、その場で適応できるインテリジェント・システムがより良い解決策となるでしょう。
生成AIはどう解決する? – 自走するソフトウェア
Excelでマクロを組むという不運な経験をしたことがある人なら、記録ボタンに見覚えがあるでしょう。一度クリックすると、Excelはユーザーが行った各アクションを記録し、各ステップを体系的にコードに変換します。Visual Basicでプログラミングする方法は知らなくとも、記録ボタンを操作してさまざまなタスクを試すことで、どの構文を複製または修正することで、どんな異なる結果が得られるかすぐにわかると思います。記録ボタンはエクセルにしか存在しませんが、Adept AIのACT-1やAuto-GPTのような完全自律型のオープンソースエージェントの基礎的なモデルは、こういったソフトウェアインターフェース上での人間の行動を再現するよう、機械に教えているのです。
これまでの「チューリングテスト」は、一般的にAIが会話において、人間の代わりとして通用するかどうかの判定に限られていましたが、生成AIは、デジタルネイティブの知識労働者のようにソフトウェアを操作する能力をどんどん獲得しています。RPAは、これまで人間レベルの精度で高度な文脈を持つタスクに対応することは困難でした。今のところは、コンピュータビジョンと機械学習を使って、フォームへの記入やレポートの作成などの反復作業を処理しています。しかし、ユニバーサルAIがコラボレーションすることで、不正請求のフラグ立て、エスカレーション、改善など、ダイナミックで連続的なプロセスを必要とするより高度なタスク処理が可能となります。
3. ノーコード・オーケストレーション(2015年~2020年)
最近では、開発者のリソースを増やすことなく、さらに複雑なプロセスを処理する必要性から、ローコード・ノーコードで編成されるプラットフォームが台頭し、例えば、Instabase社は、ドラッグ&ドロップのビジュアルインターフェイスを開発し、アプリケーションをエンド・ツー・エンドで提供しました。
ノーコードの最大の欠点:
コードを必要とするローコード: IPaaSと同様に、ノーコードのプレーヤーはアクションとトリガーを定義しています。新しい接続やタスクが導入されると、ベンダーがその機能をソリューションにネイティブに組み込むか、内部の開発リソースに頼ってグルーコード(システム同士を接続するコード)を構築し、ギャップを埋める必要があります。
生成AIはどう解決する? – No-Code + Copilot = “Co-Code”
HyperscienceやInstabaseのような企業は、モデル、アクション、トリガー、ユーザーインターフェースといったコンポーザブル・ブロックを通じてプロセス自動化のソリューションを提供しています。ノーコードのワークフロー構築は、システム・インテグレーターや開発者の多大なサポートを必要とせずに、プロセス自動化の実装と更新するという問題に対応するために設計されました。これらの事前設定済みコンポーネントは、自動化への参入障壁を下げ、価値ある時間を生み出しますが、拡張性の問題(つまり、それを処理するための事前設定済みブロックがない場合、どのようにプロセスを拡張できるか)は解決されていません。新しいデータソースのための新しいコネクタを構築したり、複数のプロセスを連結して範囲を広げたりするには、ベンダー独自のビジネスサービスからカスタムで設計する必要があり、真の意味でのセルフサービス型のソリューションとなってはいません。
ワークフローマッピングに対する、すでに実現可能な生成AIのアプローチは、簡単な言語インターフェースで行うことができます。Copilots(既存のワークフローを接続するAIアシスタント)は、まだ若干の調整が必要ですが、コードスニペットを滑らかに生成します。新しいプロセスのレシピを構築するには、プロンプトを適切に設計する方法を知っているかどうかにかかっています。今後、GPT-4の画像理解能力によって、社内のプロセスデザイナーがMiroのようなチャートツールでイベントモデルシステムを作成し、LLMで学習したプラグインや既存のAPIで、タスクを実行するコードに変換する世界が容易に想像できるようになりました。
自動化の範囲を広げるために、既存のノーコードソリューションはオーケストレーターと一緒にCopilotsを導入するべきだと思います。ノーコードは、言語インターフェースでは不可能な視覚的な特徴を提供してくれます。例えば、私たちがよく直面することを例に上げると、自分の親に新しいテクノロジーについて教えても理解できないので、絵に描いて教えるか、自分でやるしかない、というようなことです。将来的には、アプリケーションのワークフローを設計・編成構築する作業は、現在のプロダクトマネージャーと開発者の会話に似てくると思いますが、反復サイクルははるかに速く、両者の不満もおそらくはるかに少なくなるでしょう。
4.インテリジェント・プロセス・オートメーション(2020年~現在)
一般的なRPAソリューションは、人間の推論を必要としない定型的なタスクで高いパフォーマンスを発揮する一方で、より専門的でドメイン固有のプロセスではそのパフォーマンスが制限されています。例えば、ホリゾンタルなRPAソリューションでは、銀行顧客のローン返済履歴を書き出すことはできても、クレジットスコアの算出や倒産破産確率を予測することはできません。予測には特別に訓練されたモデルが必要であり、それは本質的に垂直的作業に集中することになります。文書詐欺に対応するInscribeや、買掛金を管理するIkarusといった企業が出現し、ニッチな市場でより良いパフォーマンスを提供しています。
インテリジェント・プロセス・オートメーションの最大の欠点:
一般的なインテリジェンス VS 特定的なインテリジェンス:インテリジェント・システムが複雑なタスクを処理するのに十分な情報を持っていない場合、タスクは中断されます。モデルから外れたワークフローを管理するために、人間がトレーニングや経験を共有する必要があります。
生成AIはどう解決する? – 第二の脳とパーソナルデジタルツイン
私たちは、かなり前からデジタル版の自分自身を作る試みをしてきました。2013年には、Verizon社の社員が自分の仕事をすべて中国のコンサルティング会社にアウトソーシングし、最終的には見つかって、解雇されました。ジェネレーティブAIは、すでにあなたの脳をバイト(データ)化しつつあります。Character.aiのような企業は、すでに架空もしくは実在の人物の見事なクローンを作成し、質問に答えたり新しい視点を生み出したりしています。
AIハッカーや熱心なメモ魔たちは、すでにMem.aiのような生成AIを搭載した知識ベースを第二の脳として使い始めています。コンピュータは、議会図書館の全文を読むような特定のタスクにはすぐに対応できますが、トレーニングしなければ「政治と憲法修正第2条の法律に関するあなたの個人的な考えは?」といった、非常に主観的でニュアンスの異なる質問には答えられないでしょう。
VCでAIハッカーの中島洋平氏は、売り込みをかける可能性のある企業、サポートを求める投資先企業、不安定な市場で明確さを求めるLPからの膨大な数の潜在的な質問に答えるために、パーソナライズされたチャットボット「Mini Yohei」を作りました。Personal.aiのような会社は、すでに各ユーザーのために個別の「Baby GPT」を構築しています。「Out of Office」と自動返信をする代わりに、デジタルアバターに業務時間外のメールを直接、処理させる世界を想像してください。あなたのデジタル上の双子は、それが必要で可能だと確信させてくれるでしょう。
完全自動化された企業
生成AIは、システム自動化のための最も説得力のある事例を提示し、ボットに最適化、複製、そして最も重要な推論の能力を与えることで、今ある最大のボトルネックの多くを解決することができます。これまで実装に多大な時間と費用を要していたシステムには、あらかじめ訓練されたAPIアクセスが可能なモデルを使用することで、ますますセルフサービス化が進むと思われます。ソフトウェアが自己組織化、モデル外の例外処理、コンテキストの迅速な切り替え、フィードバック主導の強化による改善を学ぶことで、範囲や拡張性が限られていたタスクの生産性が飛躍的に向上します。これらを要約すると、次のようになります。
-
RPA企業は、生成AIとプロセスマイニングを組み合わせて、最大の生産性向上の可能性がどこにあるかを特定するだけでなく、人間の介入なしにタスクを代替するコードを主体的に作成する必要がある。
-
APIに依存するワークフロー自動化および統合プラットフォームは、タスク主導型の代理アプローチを活用し、人間に依存するトリアージおよびメンテナンスを最小限に抑える必要がある。
-
ノーコードのオーケストレーターは、テキストベースのコーパイロットが機能を拡張できるようにする必要がある。
-
ナレッジベースを活用することで、インテリジェント・プロセス・オートメーションは、より深いコンテクストの問題解決能力を強化する。
新興企業であれ既存企業であれ、人間が行っているプロセスを補強したり置き換えたりしようと考えているなら、これからの製品ロードマップは生成AIを中心に設計することが必須となります。