LayerX エンジニアブログ

LayerX の エンジニアブログです。

2026-04-01から1ヶ月間の記事一覧

AIエージェントの成功率をどう引き上げるか。Long-running taskにおけるスケーリング則と検証器の役割

こんにちは!Ai Workforce事業部FDEの恩田(さいぺ)です。 AIエージェントの進化も凄まじく、どんどん長時間のタスクをこなせるようになっています。この分野のベンチマークの第一人者であるMETRでも、最新のClaude Opus 4.6で10時間のタスクが50%の確率で…

Self-Maintainable CI ── Go testの失敗をClaudeで自動修復する仕組み

はじめに LayerX バクラク事業部 Platform Engineering 部 Enabling グループの shibutani です。 CIのテストが落ちたとき、開発者がやることは意外と多いです。ログを読み、原因を特定し、担当者を探し修正依頼 or 自分で修正する。これがrace conditionやf…

AWS re:Invent 2025現地参加レポート

AWS

こんにちは、LayerX バクラク事業部でソフトウェアエンジニアをしている Tomoaki (@tapioca_pudd) です。 2025年12月、ラスベガスで開催された 「AWS re:Invent 2025」 に、LayerXから私を含めた4人のエンジニア(@kani_b, @shirakiy0, @onsd_)で参加してき…

AIエージェントのHuman-in-the-Loop評価を深化させる

本記事はAIエージェントのHuman-in-the-loopを定量評価するための手法やビジネス価値を検討します。 AIエージェントによる業務効率化やソフトウェア開発自動化が進むに従って、AIエージェントのアウトプットを人間が確認してアクションすることが増えている…