こんにちは。機械学習チームでソフトウェアエンジニアをしているTomoakiです。
バクラクはMLOpsエンジニアを必要としており、今回はバクラクでMLOpsをやる面白さや現状抱えている課題について紹介します。
バクラクとは
バクラクは経費精算、稟議申請、法人カード、請求書処理など企業の支出関連業務をAIのサポートで簡易化、効率化するサービス群です。これにより企業は経理業務の労力を大幅に削減することが可能となります。
2021年1月に初のプロダクト「バクラク請求書受取」をリリース。その後は「バクラク申請」「バクラク経費精算」「バクラク請求書発行」「バクラクビジネスカード」「バクラク電子帳簿保存」と半年に1つのペースで新規プロダクトをリリース。現在は6つのプロダクトを提供し、それぞれが企業の経理業務を支援しています。2024年2月にはお陰様で導入社数が10,000社を突破しました。
2021年12月には、SaaS企業の目標の一つであるARR100億円を26年度までに達成すると公表しておりましたが、2023年2月には25年度までにARR100億円を達成すると目標を1年前倒しにしており、当初の予想を上まるペースで成長しています。
バクラクが目指す未来
バクラクは「圧倒的に使いやすいプロダクトを届け、ワクワクする働き方を。」をビジョンに掲げています。深い顧客理解とUXへのこだわりをもとに、業務プロセスをスムーズにし、ミスの発生しにくい難しい業務を「楽しい!」と感じられるほどの体験に変えることを目指しています。
我々は、2兆円を超えるマーケットに挑戦しています。それはSaaSに親しみのあるIT系のスタートアップだけでなく、エンタープライズ企業を含むあらゆる企業をターゲットに、「楽しい!」と言ってもらえる体験を届け、すべての働く人をめんどくさい業務から解放することを目指しています。
コンパウンド戦略から生まれるバクラク体験
圧倒的に使いやすい体験を届けるために我々が重視しているのはコンパウンド戦略です。コンパウンドスタートアップ(コンパウンド戦略を実施するスタートアップ)は、従来の「部署」別SaaSに代わり、部署を超えた「データ」を中心に体験を再構築し、業務を一気通貫でサポートします。これにより、各部署の業務が一元化され、業務の効率化が図られます。
バクラクは現在、「法人支出データ」を中心に会社で発生する課題を一気通貫で取り扱うコンパウンドスタートアップとして展開しています。これにより、経理業務の全体像を把握し、最適な業務フローを構築することが可能となります。
AI-UXから生まれるバクラク体験
コンパウンド戦略に加え、圧倒的に使いやすい体験を作るためには、機械学習を活用した機能が不可欠です。私たちはAI-UX(AIを前提とした利用体験)をプロダクトのコア体験として設計しています。これにより、AIの力を最大限に活用し、ユーザーにとって最高の体験を提供します。
AI-UXの重要なポイントは「業務自体をなくす」ことです。紙やPDFなどの非構造データを構造化データに変換する転記作業がOCRによって不要になるように、業務の自動化を進めます。
例えば、バクラクでは請求書ファイルをアップロードするだけで、請求書内の金額・取引先名・支払期日・振込先口座など必要な情報を自動で読み取り、さらに会計帳簿に記帳するために必要な仕訳データを過去の仕訳を基に自動で作成します。経理担当者はアップロード後はその仕訳の確認だけになり、請求書の転記作業や、過去の仕訳を参照しながら仕訳を作成する作業がなくなり、経理業務の効率化が実現します。
バクラクでは、書類のOCR、与信付与、推薦システムなど全プロダクトにおける機械学習機能の開発を進め、それを前提とした体験を設計しています。これにより、AIの力を最大限に活用し、ユーザーにとって最高の体験を提供します。
コンパウンド × AI-UXを支えるMLOpsという挑戦
①半年に一度のペースでリリースされる新規サービス
コンパウンドスタートアップでは、データを起点にその周辺業務をどんどんつなげていくことで一気通貫した業務が実現できます。我々は半年に1つのペースで新規プロダクトをリリースしており、これまで分断されていた業務をつなげています。
新しいプロダクトには必ず機械学習を活用した機能が組み込まれているため、そのドメインのデータを集め、モデルを作成し、サーブし、運用できる体制を都度構築する必要があります。また、チームがスケールするに従って、今の内から基盤を標準化しておかないと、統制が取れなくなって、高速に課題を解決できるチームで無くなってしまうという危機感があります。
標準化は多くの企業が組織が大きくなった後に始めるものかもしれないですが、課題を高速に解決できる組織を作るためには、複数人が自主的に思考し、その結果を高速に共有し、アラインを取りながら進めることが必要ですので早い段階からここに投資していきたいと考えています。
②複雑に絡み合うドメイン
コンパウンドスタートアップは、隣接するドメインの課題を高速に解決していきます。例えば、請求書のOCRモデルをリリースした後に、領収書のOCRモデルを開発するなど、同じOCRでも微妙にドメインが異なる課題を解決することが日常的に行われています。
共通化できる部分は共通化し、分けなければならない部分もあります。複雑に絡み合うドメインの課題をどのようにシステムとして運用していくかは、エンジニアとしての設計力・技術力を試されるところです。
③新しい顧客層の獲得に伴うデータの量と性質の変化
AI-UXは諸刃の剣です。AIが正しく機能している限り、魔法のような体験を提供できますが、逆にうまく機能しない場合、ユーザー体験が大きく損なわれかねません。
バクラクでは、全ての働く人にサービスを提供するため、常にターゲット顧客層を広げています。その結果、データの傾向が全く異なるお客様が突然増えることが頻繁に起こります。
これに対応するために、AIが機能しない場合でも体験を損なわないようなアプリケーションの工夫が必要です。また、MLOpsの観点から言うと、このような状況を高速に検知し、性能改善できる仕組みが必要です。あらゆる業種のお客様の体験も保証するためには、適切にモニタリングできる仕組みやデータを偏りなく集め学習に使えるようにする仕組みが必要になります。
また、大企業では扱う書類の数やマスタデータのサイズが大きいため、データ収集のプロセスが突然遅くなったり、メモリが足りなくなったりと予期せぬエラーが発生するため、データ量の変化に対してロバストである必要もあります。
バクラクは1人目のMLOpsエンジニアを必要としています
バクラクの機械学習チームには、MLOpsを専門に行っている人はいません。
バックエンドエンジニアと機械学習エンジニアが協力して、これまでMLOps的なことを行ってきました。しかし、今後より高速に機械学習を基盤とした機能を提供するために、MLOpsを専任で行う1人目のエンジニアが必要です。
直近で抱えている大きな課題を一部紹介します。
実験の効率化
学習、推論、後処理、評価のパイプラインを一貫して実行する仕組みが現状では整っていません。Vertex AI Pipelinesを利用してモデルの再学習の負荷を軽減するなど、限られたリソースの中で一定の効率化は進めてきましたが、パイプライン全体ではまだ自動化やリトライの仕組みなどが整っていません。
また、大量に並列で実験を進め、実験結果を共有できる仕組みを構築することで、検証のスピードを高速化し、モデル開発を劇的に加速させる仕組みを作りたいと考えています。
高速でモデルをサーブできる仕組みの構築
今後、MLモデルを爆速でサーブできるようにするために、機械学習エンジニアがモデルを作成したら簡単にサーブまで行える仕組みが必要です。
ECS、SageMaker Endpoint、Vertex Endpointなどにデプロイできる基盤を考えていますが、まだ何も進めていません。
LLMOps
現状では何もできていないに近いです。LLMを活用した機能開発は進めていますが、どのように精度を評価し、改善サイクルをどのように回すかの議論から始める必要があります。
さいごに
バクラクの機械学習チームにはKaggle Grandmasterをはじめとする経験豊富な機械学習エンジニアが在籍しており、このようなチームで協力しながら機械学習基盤の構築を進めることができる環境があります。
機械学習基盤の開発の経験があるけどすでにある程度成熟してしまって新しいチャンレンジを求めている方、大きな裁量を持って働きたいと考えている方など、チャレンジの機会を求めている方を大募集しています。
上記の課題にすべて精通していなくても大丈夫です。少しでも興味が湧いた方は、ぜひご応募・カジュアル面談お待ちしています。