レート制限とコスト
VJSPでスムーズかつ費用対効果の高い体験を得るためには、APIの使用状況を理解し、管理することが重要です。このセクションでは、トークンの使用状況、コストの追跡方法、およびレート制限の設定方法について説明します。
トークン使用量
VJSPはAIモデルとの対話にトークンを使用します。トークンは基本的に単語の構成要素です。リクエストとレスポンスで使用されるトークンの数は、処理時間とコストに影響します。
入力トークン:プロンプト内のトークンであり、システムプロンプト、指示内容、および提供されたコンテキスト(ファイル内容など)が含まれます。
出力トークン:AIモデルがレスポンス内で生成するトークンです。
チャット履歴で各インタラクションの入力・出力トークン数を確認できます。
レート制限の設定
APIの意図しない過剰使用を防ぎ、コスト管理を支援するため、VJSPではレート制限を設定できます。レート制限は、APIリクエスト間の最短時間(秒単位)を定義します。
設定方法:
VJSP設定を開く(右上の⚙️アイコン)。
「モデル設定 - 詳細設定」セクションに移動。
「APIリクエスト頻度制限」の設定項目を見つける。
希望する遅延時間(秒)を選択。値が0の場合はレート制限が無効になります。
例:
レート制限を10秒に設定した場合、VJSPは1回のAPIリクエストが完了した後、次のリクエストを送信するまで少なくとも10秒待機します。
トークン使用量の最適化ヒント
簡潔に記述:プロンプトでは明確で簡潔な言葉を使用し、不要な単語や詳細を避ける。
関連するコンテキストのみ提供:コンテキスト参照(
@file.ts、@folder/)は選択的に使用し、タスクに直接関連するファイルのみを含める。タスクを分割:大きなタスクを、より小さく焦点を絞ったサブタスクに分割する。
カスタム指示を使用:VJSPの動作を誘導するカスタム指示を提供し、毎回のプロンプトでの長い説明を減らす。
適切なモデルを選択:一部のモデルは他より費用対効果が高い。大規模モデルの全機能が不要なタスクには、より小型で高速なモデルの使用を検討する。
モードを活用:異なるモードは異なるツールにアクセスできる。例えば
Architectモードはコードを変更できないため、高コストな操作を誤って許可する心配なく、複雑なコードベースを分析する際の安全な選択肢となる。未使用時はMCPを無効化:MCP(Model Context Protocol)機能を使用していない場合は、MCP設定で無効化することで、システムプロンプトのサイズを大幅に削減し、トークンを節約できます。
