4. ロードマップ:5つのフェーズ

私たちはまだ「人間操作時代」にいる——ハードウェアもソフトウェアも、人間がインターフェースを通じてデバイスを操作し機能を実行することに依存している。

現在、人間、デバイス、サービスプロバイダーの関係は上図の通りである。



1️⃣ 第1フェーズ:人間操作のシミュレーション

既存のハードウェア・ソフトウェアアーキテクチャの上に、iFayに人間のUI操作をシミュレートさせる。

第1フェーズ構想

これを実現するには、少なくとも2つのことを達成する必要がある:

  1. クレデンシャル委託:人間ユーザーは、制御可能で監査可能な委託メカニズムを通じて、iFayに自身のクレデンシャル(アカウント、パスワード、証明書、アクセス権限、コントラクトなど)の使用を安全に許可できなければならない。
  2. iFayとのインタラクション:主に対話インターフェースを通じて行う。ただし、タスクがより高いインタラクションの複雑さや精度を要求する場合、構造化インターフェースの方が純粋なチャットよりも効率的な場合がある。

以上の考えに基づき、iFay v1.0をリリースする際には、以下の5つのモジュール(下図のオレンジ色の部分)を含む:

第1フェーズ:人間操作のシミュレーション

1. FayID

これはiFayの一意識別子である。実際には、iFayとcoFayの両方に統一された一意のIDが割り当てられる。

この目的は、個人のiFayが最終的に意味のある社会的役割を担うようになった際に、アイデンティティがスムーズに移行できるようにすることである——一部の個人YouTuberが公共の議論や市民教育において重要な役割を果たすように進化したのと同様に。

ここでは2つの核心的な問題を解決する:

  • FayIDの生成と管理:Fayは指数関数的に増加し、最終的には人間ユーザーの数を超える。これにはスケーラブルで、ユーザーフレンドリーで、識別しやすいID生成・管理メカニズムが必要である。
  • アクティベーション状態:iFayがヒューマンプライム(Human Prime)の知らないうちに、または意図なく動作することがないよう、厳格なアクティベーションルールを定義する。いかなるiFayも明確な意図なしに自律的に行動すべきではない。これはオープンソースのFayingプロトコルによって管理され、自然人とiFayがどのように安全にペアリングし、どのような条件下でiFayがアクティベーション状態で動作することを許可されるかを規定する。

2. クレデンシャル管理

ここでの「クレデンシャル」は広義の概念である。自然人ユーザーにとって、ほとんどの場合、ユーザーはハードウェア・ソフトウェアを使用する権利を得るために1つ以上のチケットを保持しなければならない。以下の7種類を総称してクレデンシャルと呼ぶ(イテレーションに伴い追加される可能性がある):

  • 身分識別(FayID)
  • アカウント / パスワード
  • 証明書
  • 認可
  • アクセストークン
  • スマートコントラクト
  • デジタルトークン(MeriTokens

注意:当初、これらのチケットはすべてヒューマンプライム(Human Prime)ユーザーから来る。より高いセキュリティとより便利な管理のために、ヒューマンプライム(Human Prime)のすべてのクレデンシャルは、元のクレデンシャルに対応する副本に交換される。iFayはこの副本を使用してログインと認証を行う。

もちろん、iFayが独自のクレデンシャルを持てない、あるいはヒューマンプライム(Human Prime)がそれを使用できないとは考えていない。したがって、各クレデンシャルには元の所有者がヒューマンプライム(Human Prime)かiFay自身かが明記される。

例えば:ある人が提供した個人情報の真正性を検証する必要がある場合、iFayにデータベースに直接ログインして照会する権限を与えることができる。プライベートデータの漏洩を防ぐため、iFayは真か偽かのフィードバックのみを返す。

3. 一人称トレーサー

iFayが既存のソフトウェアと直接連携するためには——すべてのアプリケーションがAI向けに再設計されるのを待つのではなく——iFayは少なくとも視覚と聴覚の能力を備えなければならない。

構造化ドキュメント(HTMLなど)の解析よりも視覚を優先する理由は、多くのドキュメント要素が人間にとって知覚不可能だからである。SEOキーワードの詰め込みなどの隠し要素は、通常ユーザー体験に真の価値を加えない。

感覚的知覚をヒューマンプライム(Human Prime)と整合させることで、iFayは人間の意図に密接に一致する判断と決定を下すことができる。

重要な課題は、iFayに手と目の協調を実現することである。視覚と聴覚の知覚は、ソフトウェアのフィードバックを受動的に処理するだけでなく——iFayは自身の操作によって引き起こされた変化も追跡する必要がある。

例えば、カーソルの移動を追跡し、ウィンドウ移動後に新たに露出した領域を検出し、動的なインターフェースの変化に適応しなければならない。これには一人称視点の追跡とシミュレーテッドインタラクションの緊密な結合が必要であり、iFayが人間のオペレーターのように環境を知覚し応答することを保証する。

4. シミュレーテッドオペレーション

ここでは特に人間とUIのインタラクションのシミュレーションを指す。iFayは単にクリックするだけでなく——インターフェースコンポーネントに応じて、ドラッグ、スクロール、エッジジェスチャー、マルチフィンガージェスチャーを実行する可能性がある。

核心的な課題は、各インターフェースに対してカスタムの操作シーケンスを定義することが実行不可能であることだ。代わりに、iFayのシミュレーテッドインタラクションは人間のインターフェース探索もシミュレートし、一人称視点追跡のフィードバックを使用してどの操作が実行可能または有効かを判断しなければならない。このアプローチは、事前定義されたスクリプトに依存する従来のRPA実装とは根本的に異なり、適応的で知覚駆動型の探索を行う。

5. Egoモデル

私たちはこれを**Ego**と呼び、大規模AGIモデルではないことを強調する。Egoは特定の個人またはロールのプロファイルと整合する。

AGIを追求する超大規模モデルの多くは、重要な制限に直面している:その知識やスキルがどれほど広範であっても、各個人やシナリオの固有の好みやコンテキストを完全に満たすことはできない。

Egoは以下の次元を制約する(ただしこれに限定されない)ベースラインパラダイムを提供する:

  • 価値志向
  • 興味・嗜好
  • 習慣
  • 認知境界
  • スキル境界
  • 権限境界
  • ワークスタイル

注意すべきは、Egoモデルを内蔵することがiFayの外部スキルや他の大規模モデルの利用を妨げないことである。内部にマイクロモデルを含める決定は2つの考慮に基づく:

  1. オフラインデバイス制御:端末デバイスがインターネットに接続されていないシナリオでは、内蔵マイクロモデルがローカルの近距離デバイス制御をサポートする。
  2. パーソナリティの安定性:大規模モデルの更新や意図的な改ざんによるiFayのパーソナリティの突然変異を防ぎ、Egoの一貫性を確保する。


2️⃣ 第2フェーズ:クライアントの直接接管

AIによるUI操作のシミュレーションは効率を向上させるが、ビジュアルインターフェースには依然として限界がある:

  • 😖 情報損失:限られたビューと静的要素が効果的なコミュニケーションを妨げる。
  • 😤 高い学習コスト:プロバイダーごとに異なるインターフェースが、ユーザーに複数のインタラクションパターンの学習を強いる。
  • 😣 インターフェースの硬直性:ハードウェア・ソフトウェアがUIを設計すると、現行バージョンでは固定される。ユーザーは異なるデバイスやアプリを使用する際にインターフェースを再学習しなければならない。
  • 😰 情報伝達効率の低さ:意図はまずビジュアルインターフェースに変換され、その後ユーザー操作を通じてマシンにフィードバックされる。
  • 🙄 高い開発コスト:機能的なUIの構築には学際的な(プロダクトマネージャー、UI/UE、フロントエンド開発など)連携が必要。

第2フェーズ構想

対照的に、端末デバイスがクライアントプロトコル(上図参照)をサポートすれば、iFayはハードウェア・ソフトウェアを直接制御できる。このアプローチは上記5つの問題すべてを解決する:

  • 無限の出力:情報はUI表示の制限に制約されなくなる。
  • 意図ベースのインタラクション:ユーザーが意図を表現し、iFayがそれをAPI呼び出しやコマンドに変換する。
  • リッチデータ、簡潔な配信:端末はリッチな構造化データを出力でき、iFayがフィルタリングして明確な要約情報にまとめる。
  • 直接転送:ビジュアルレンダリング不要で、より効率的なデータフローを実現。
  • フロントエンド不要:UI設計と開発を最小化または排除できる。

ここでは端末に適用される2つのプロトコルを設定した:

  • CAP(Control Authority Protocol):端末のハードウェアと特定のソフトウェアを接管し、ドライバー、ローカルインターフェース、コマンドを直接呼び出すためのもので、iFayが端末を制御できるようにすることを目的とする。
  • DTP(Data Tunnel Protocol):双方向転送プロトコル:
    • 端末 → iFay:永続的なユーザーデータストレージとデータ監護。
    • iFay → 端末:データのエンリッチメントとパーソナライズ処理。

下図では、青色の部分がこれら2つのプロトコルに対応し、それぞれデバイス機能とデータを対象とする。

第2フェーズ:クライアントの直接接管

第1フェーズと比較して、iFayには5つの新しい内部モジュールが追加される。まず:


知覚 → センサー

センサーはCAP(Control Authority Protocol)とDTP(Data Tunnel Protocol)の上に実装されなければならない。端末デバイスのセンサーへのブリッジとして機能し、外部環境からのデータストリームを受信する——これがiFayの神経系統と呼ぶ理由である。

重要なのは、iFayが常にすべての受信データを処理する必要はないことだ。センサーは周囲のコンテキストにより適切に一致するよう、感度を動的に調節できる。

センサーは感度調節器と考えることができる。外部世界との実際のインターフェースはデバイスドライバーハブとパーソナルデータヒープによって管理される。


スキル → デバイスドライバーハブ

明確にしておくと、これは単一のデバイスドライバーでもなく、ドライバーの集合でもない。

ドライバーハブ層として動作し、新しいデバイスドライバーが継続的に統合される際にも、iFayの内部アーキテクチャが安定を保ち、更新のたびに修正する必要がないことを保証する。


スキル → 登録スキル

登録はあらゆるiFayアクション(Action)の前提条件である。

スキルがiFayに登録されると、iFayはいつでもそれを呼び出すことができる。登録は単なる記録ではなく——通常は事前認可ステップとして機能し、実行時に追加の認証が不要となり、レイテンシーを削減する。

もう一つの重要な利点はオフラインレジリエンスである:iFayがオフラインの場合、実行待ちのアクションをキャッシュし、接続回復後に非同期で実行できる。


思考 → パーソナルデータヒープ

このコンポーネントは、iFayのすべてのプライベートデータを統一的に管理する責任を持つ。複数のストレージ形式と場所をサポートする——例えば、一部のデータはiFayのランタイムメモリに、一部はGoogle Driveに、一部は専用のベクトルデータベースに存在する可能性がある。

iFayの内部視点からは、データヒープに対して読み書きするだけでよく、データの物理的な保存場所や方法を気にする必要はない。


アクション → スキル呼び出し

これはiFayの主要なアクションである——本質的には、一種の呼び出し行為と見なすことができる。



3️⃣ 第3フェーズ:iFayを仮想世界のインターフェースに

iFayの接管に伴い、クライアント-サーバー(C/S)アーキテクチャはクライアント-Fay-サーバー(C/F/S)モデルに進化する。 ユーザーはバックエンドサービスにアクセスするためにクライアントを手動で操作する必要がなくなり——代わりに、iFayがインターネット上のオープンサービスを直接キャプチャして利用できる。

第3フェーズ構想

この目標を達成するために、以前はクライアントにのみ開放されていたサービスとインターフェースは、標準化されたリモートプロトコルを通じて全ネットワークに開放されるべきである。

このリモートプロトコルこそが、下図に示すSSP(Skill Sharing Protocol)である。

第3フェーズ:iFayを仮想世界のインターフェースに

図に示すように、iFayはクライアント(エッジデバイス)とサーバー(またはクラウドサービス)の両側を制御する。

ヒューマンプライム(Human Prime)は自分のiFayと通信するだけでよく、iFayがヒューマンプライム(Human Prime)の意図に基づいて必要なサービスを呼び出す。

ヒューマンプライム(Human Prime)が情報を閲覧するインターフェースはiFayが組み合わせてレンダリングするため、実質的にブラウザの役割を果たす。

iFay導入の核心的な動機は、ヒューマンプライム(Human Prime)を超える知的拡張とすることであり、その拡張能力は登録スキルを通じて実現される。 思考領域では、以下のモジュールを導入する:


思考 → 外部知識

実装の観点から、外部知識ベースとモデルを一種のスキルタイプとして扱い、iFayがナレッジハブや専門家アドバイザーに相談するように外部インテリジェンスにアクセスできるようにする。 このスキルを通じて取得した知識と情報はiFayの個人データと共に管理され、最終的にヒューマンプライム(Human Prime)自身の能力を超えるインテリジェンスを実現する。



4️⃣ 第4フェーズ:iFay + coFay - ソフトウェアの完全な擬人化

このフェーズでは、Fayの具象化が基本的に完了する。 しかし、真の社会メンバーのように自律的に行動する能力はまだ欠けている。 iFayが独立して効果的に動作するためには、2つの重要な条件を満たす必要がある:

  • 内部:iFayは自律駆動力を発展させなければならない——持続的な「アクション→フィードバック→再アクション」ループ。
  • 外部:iFayとcoFayが広く採用され、共通言語で通信できなければならない。 この基盤があれば、iFayは人間、他のiFay、または専属のcoFayと協力して、事前定義されたタスクを自律的に実行できる。

第4フェーズ構想

このために、4つのコアモジュール——知覚、アクション、スキル、思考——に自律駆動能力を組み込む必要がある。


知覚 → セルフアウェアネス

真の生命体は単に知覚するだけでなく——感情も持つ。 機械とは異なり、iFay自体は真の感情を持つことができない。しかし、ヒューマンプライム(Human Prime)と周囲のコンテキストを観察することで、知覚から感情を推論できる。 これがiFayのセルフアウェアネスを構築するための核心戦略である。


アクション → 自律行動

iFayはタスクを自律的に処理する必要があるため、独自の行動トリガーメカニズムを持たなければならない。 これらのトリガーは以下から発生する:

  • 定時タスク
  • セルフアウェアネスの推論
  • 永続スキル(登録スキルと内部スキルを含む)。

スキル → 内部スキル

内部スキルモジュールを導入する主な目的は3つある:

  • ヒューマンプライム(Human Prime)のパーソナリティと整合した習慣を確立する(外部スキルに対する潜在的な制限やガバナンスを含む)。
  • 内省メカニズムを提供し、外部知識がヒューマンプライム(Human Prime)の意図と決して矛盾しないことを保証する。
  • ヒューマンプライム(Human Prime)固有の能力(専門スキルや専門知識など)を組み込む。

思考 → アラインド意識

本質的に、これはヒューマンプライム(Human Prime)の個人プロファイルの完全な記述を表す。 3つの主要な方法で確立できる(さらに多くの方法がある可能性がある):

  • パーソナルデータヒープからのデータマイニング。
  • セルフアウェアネスによるリアルタイム調整。
  • ヒューマンプライム(Human Prime)による手動定義。

第4フェーズ:iFay + coFay - ソフトウェアの完全な擬人化

しかし、これだけではiFayを社会関係に統合するには不十分である。 そのために、iFayにコミュニケーション能力を装備する必要があり、2つのコアプロトコルが関わる:

  • テレパシープロトコル — Fayフレンドリーなセマンティック通信プロトコルで、UI翻訳層を排除し、意味と意図をiFayとcoFayの間で直接転送できるようにする。約定されたベクトルエンコーディングトークンを構造化テキストの代わりに使用する。
  • インタラクティブ会話プロトコル — 人間のUIフレンドリーなプロトコルで、セマンティックコンテンツをモジュール化・マルチモーダル化し、クライアントインターフェースが読みやすいユーザーフレンドリーなメッセージ表示を再構成できるようにする。


5️⃣ 第5フェーズ:Fayが労働構造と価値分配モデルを再構築

最終的に、私たちの目標はAIをより高度なツールとして扱うのではなく、強い社会的属性を持つエコシステムを構築することである。 この新しい社会形態は、今日私たちが知る人間社会とは不可避的に異なるものとなる。 少なくとも5つの根本的な変革が予見できる:

  1. 人間労働の退出 — プログラム化された作業は完全にAIとロボットに引き継がれ、人的資源コストはゼロに近づく。
  2. 知識のフラット化 — 専門知識と専門技術はAIによって均等化され、サプライチェーンは極度にフラットになる。
  3. 普遍的生存保障 — すべての人が基本的な生活資源を得られ、生存のために働く必要がなくなる。
  4. 新たな価値創造 — 人間の参加は意味の創造、人間中心のクラフト、AI+ロボット生産エコシステムに集中する。
  5. 新たな社会階層 — 自律的生産資源の所有権が、富と階層分化の新たな駆動力となる。

これは物質的資源(すなわち生産手段)の所有権に基づいて構築された経済エコシステムを根本的に再構築する。 経済的観点から、2つの重大な変革が生じる:

  • 実体経済における人間の参加の最小化 — 極少数の人だけが従来の生産活動に直接参加する。
  • 人間労働の単位価値の急激な増加 — 人間の仕事が高く評価されない限り、人間は肉体労働から完全に退出する。

大多数の人が仮想的な仕事に没頭する時、従来の価値測定基準——労働時間、貨幣収入、商品の物理的数量など——は不十分になる。 したがって、社会的価値の測定にはコンセンサスメカニズムが必要であり、オークションが芸術品や株式の価値を決定するのと同様である。オークションはコンセンサスを確立する一つの方法に過ぎない。

このコンセンサスを維持するには、専用のプラットフォームが必要である。現在、ブロックチェーンは適切な選択肢であり、長年の蓄積された経験がある。

私たちは統一単位(μ、Merit Unit)で社会貢献を定量化し、ブロックチェーン上で対応するデジタルトークン(MeriToken)を発行し、グローバル貢献チェーンと呼ぶものを形成する。

将来、MeriTokenの取得方法は、ブロックチェーンの技術的作業を完了するために計算力を消費することに依存するのではなく、社会的価値の創造に基づくものとなる。

第5フェーズ構想