8月 2025 - 3ページ目 (5ページ中)

[AWS]Bedrock RAGのパフォーマンス・チューニング

Amazon Bedrock RAGの「パフォーマンス」は、主に以下の3つの側面から成り立っています。これらをバランス良く、または目的に応じて重点的に改善していくことがチューニングの鍵となります。回答精度 (Relevance/Accura...

2025.08.15

AI

[AWS]Bedrockで正確な情報出力が必要な場合

Bedrockで正確な情報の出力が必要な場合、基本的にはRAGを選択するのが正しいアプローチです。ただし、タスクの性質によってはAgentが最適となるケースもあります。結論から言うと、両者の選択は「情報の出所とタスクの複雑さ」によって決まり...

2025.08.14

AITIPS

トークンをカウントする

Linuxの標準コマンドだけでOpenAIの公式なトークン数と完全に一致させるのは困難です。なぜなら、トークナイズ（文章をトークンに分割する処理）のルールがモデルごとに複雑だからです。しかし、「近い近似値」を素早く計算する便利なコマンドと、...

2025.08.14

AITIPSコマンド

トークンとは？

ChatGPTのような生成AIにおける「トークン」は、多くの人が直感的に考える「単語数」や「文字数」、あるいは「ファイルサイズ」とは少し異なる、AIが言語を処理するための独自の基本単位を指します。結論から言うと、トークンは「AIが文章を意味...

2025.08.14

AITIPS

wcコマンド

wcは "word count" の略で、テキストファイルや標準入力の行数 (lines)、単語数 (words)、バイト数 (bytes)/文字数 (characters) をカウントするためのLinux/UNIXコマンドです。シンプルな...

2025.08.13

コマンド

[AWS]Aurora PostgreSQLのチューニングでBedrockの性能を最大化

Amazon Bedrock のバックエンドで PostgreSQL（特に Aurora PostgreSQL）を使用する場合、パラメータチューニングは有効です。適切なチューニングにより、ベクトル検索のレイテンシ削減、RAG（Retriev...

2025.08.13

ツール

[AWS]レスポンス速度に差が出る理由！BedrockRAGとAgentの決定的な違い

Amazon Bedrockでテーブルスキーマ情報を管理する際、Knowledge Base（RAG）と Agent では、レスポンス速度と機能性に明確な違いがあります。結論から言うと、レスポンス速度はKnowledge Base（RAG...

2025.08.13

ツール

[AWS]トークン上限突破！NL-to-SQLの壁を壊すBedrock RAG活用法

Amazon Bedrockでトークンの上限を超えるような巨大なテーブル構成（データベーススキーマ）を読み込ませ、自然言語での問い合わせ（NL-to-SQL）などに活用するには、すべてのテーブル定義を一度にプロンプトへ含めるのではなく、必要...

2025.08.13

ツール

[AWS]Bedrockエージェントのスキーマ設定

Amazon BedrockでAIがデータベースを理解し、自然言語からSQLを自動生成するためのスキーマ定義ファイルの作成手順を解説します。JSON形式が推奨されており、テーブル名、カラム名、データ型、主キー、外部キーなどを正確に記述するこ...

2025.08.12

TIPS

OpenSearchとRDBとNoSQLの賢い使い分け

OpenSearch Vector DBは、RDBが苦手とする意味や文脈を理解する「セマンティック検索」に特化したデータベースです。ユーザーの自然言語による質問への応答や、レコメンド、画像・音声検索などで力を発揮します。一方、RDBは厳格な...

2025.08.12

ツール

2025-08

[AWS]Bedrock RAGのパフォーマンス・チューニング

[AWS]Bedrockで正確な情報出力が必要な場合

トークンをカウントする

トークンとは？

wcコマンド

[AWS]Aurora PostgreSQLのチューニングでBedrockの性能を最大化

[AWS]レスポンス速度に差が出る理由！BedrockRAGとAgentの決定的な違い

[AWS]トークン上限突破！NL-to-SQLの壁を壊すBedrock RAG活用法

[AWS]Bedrockエージェントのスキーマ設定

OpenSearchとRDBとNoSQLの賢い使い分け