レート制限とコスト

VJSPでスムーズかつ費用対効果の高い体験を得るためには、APIの使用状況を理解し、管理することが重要です。このセクションでは、トークンの使用状況、コストの追跡方法、およびレート制限の設定方法について説明します。

トークン使用量

VJSPはAIモデルとの対話にトークンを使用します。トークンは基本的に単語の構成要素です。リクエストとレスポンスで使用されるトークンの数は、処理時間とコストに影響します。

チャット履歴で各インタラクションの入力・出力トークン数を確認できます。

APIの意図しない過剰使用を防ぎ、コスト管理を支援するため、VJSPではレート制限を設定できます。レート制限は、APIリクエスト間の最短時間（秒単位）を定義します。

設定方法：

例：

レート制限を10秒に設定した場合、VJSPは1回のAPIリクエストが完了した後、次のリクエストを送信するまで少なくとも10秒待機します。

簡潔に記述：プロンプトでは明確で簡潔な言葉を使用し、不要な単語や詳細を避ける。
関連するコンテキストのみ提供：コンテキスト参照（@file.ts、@folder/）は選択的に使用し、タスクに直接関連するファイルのみを含める。
タスクを分割：大きなタスクを、より小さく焦点を絞ったサブタスクに分割する。
カスタム指示を使用：VJSPの動作を誘導するカスタム指示を提供し、毎回のプロンプトでの長い説明を減らす。
適切なモデルを選択：一部のモデルは他より費用対効果が高い。大規模モデルの全機能が不要なタスクには、より小型で高速なモデルの使用を検討する。
モードを活用：異なるモードは異なるツールにアクセスできる。例えばArchitectモードはコードを変更できないため、高コストな操作を誤って許可する心配なく、複雑なコードベースを分析する際の安全な選択肢となる。
未使用時はMCPを無効化：MCP（Model Context Protocol）機能を使用していない場合は、MCP設定で無効化することで、システムプロンプトのサイズを大幅に削減し、トークンを節約できます。