LayerX の提供するバクラクAIエージェントを題材に、Langfuse を利用したAIエージェント機能の性能評価の取り組みについて紹介します。今回は、性能評価の肝であるデータセット構築について紹介します。次回は、そのデータセットを用いて実際に性能評価を実…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。