LayerX エンジニアブログ

LayerX の エンジニアブログです。

AIエージェントの成功率をどう引き上げるか。Long-running taskにおけるスケーリング則と検証器の役割

こんにちは!Ai Workforce事業部FDEの恩田(さいぺ)です。 AIエージェントの進化も凄まじく、どんどん長時間のタスクをこなせるようになっています。この分野のベンチマークの第一人者であるMETRでも、最新のClaude Opus 4.6で10時間のタスクが50%の確率で…

Self-Maintainable CI ── Go testの失敗をClaudeで自動修復する仕組み

はじめに LayerX バクラク事業部 Platform Engineering 部 Enabling グループの shibutani です。 CIのテストが落ちたとき、開発者がやることは意外と多いです。ログを読み、原因を特定し、担当者を探し修正依頼 or 自分で修正する。これがrace conditionやf…

AWS re:Invent 2025現地参加レポート

AWS

こんにちは、LayerX バクラク事業部でソフトウェアエンジニアをしている Tomoaki (@tapioca_pudd) です。 2025年12月、ラスベガスで開催された 「AWS re:Invent 2025」 に、LayerXから私を含めた4人のエンジニア(@kani_b, @shirakiy0, @onsd_)で参加してき…

AIエージェントのHuman-in-the-Loop評価を深化させる

本記事はAIエージェントのHuman-in-the-loopを定量評価するための手法やビジネス価値を検討します。 AIエージェントによる業務効率化やソフトウェア開発自動化が進むに従って、AIエージェントのアウトプットを人間が確認してアクションすることが増えている…

FDEって何するの? 現場の泥臭さが「はずみ車」となってプロダクトを強くするリアル

こんにちは。fjm2uです。昨年の11月からAi Workforce事業部のFDE(Forward Deployed Engineer)チームでインターンさせていただいております。 この記事では、Ai Workforce事業部のFDEチームへの応募を検討している方向けに、FDEという仕事の特徴と、インタ…

AIの提案が正しそうなのに動かない理由を、uvicornのソースコードを読んで理解した話

こんにちは。LayerX Ai Workforce事業部でSWEとしてインターンをしているYuです。 本記事では、AIの提案をそのまま実装してうまくいかなかった経験や、フレームワークのソースコードを読んで解決に至ったプロセス、そしてその過程で感じたことについてお話し…

OpenClaw-RLで学ぶAgentic RLの報酬設計

はじめに こんにちは!LayerXのバクラク事業部で機械学習エンジニアをしている宇都(@kuto_bopro)です。最近エージェントに関する論文を読んでいると「Self-Evolving」というキーワードを持つ論文をよく目にします。Self-Evolvingは自己進化・自己改善を意味…

Python製ETL「dlt」を選んだ話 - Azure Cosmos DB for PostgreSQL × Container App Jobでいい感じにDatalakeを構築する

こんにちは。LayerX Ai Workforce事業部でSREをしています @shinyorke(しんよーく)と申します。 最近はAi Workforceのデータ周りの基盤を作る仕事をしながら、個人としては野球解説AI Agentの開発を頑張っています。 本ブログでは、Ai Workforceのデータ周…

言語処理学会第32回年次大会(NLP2026) 参加レポート

こんにちは、Ai Workforce事業部 プロダクト部 FDEグループ エンジニアの堤(@ozro_223) です。この記事は2026年3月9日〜13日に栃木県宇都宮市のライトキューブ宇都宮で開催された 言語処理学会第32回年次大会(NLP2026)の参加レポートです。 LayerXとしては、…

AIエージェントを強くする『合成データ』作成のニッチなTips集

この記事は、LLM や AI エージェントを使って「AIエージェントのための合成データ」を作るための実践的な Tips 集です。