LayerX エンジニアブログ

LayerX の エンジニアブログです。

LayerXがコンピュータビジョン分野の研究コミュニティに協賛した背景 - cvpaper.challenge Conference winter 2024に協賛しました -

LayerXは2024年12月14日(土)に開催された cvpaper.challenge Conference winter 2024 (CCCW2024)に協賛し、会場提供を行いました。cvpaper.challenge Conference とは、コンピュータビジョン分野の研究コミュニティである cvpaper.challenge が主催するイベントです。以下はCCCW2024のイベントページからの引用です。

CCC(=cvpaper.challenge Conference)は,Computer Vision の分野動向調査,国際発展に関して議論を行うcvpaper.challenge が主催するオンラインシンポジウムです.

第8回となる今回は,招待講演に立野 圭祐 氏(Google)にご登壇していただく予定です.

その後,立野氏に加えCV分野を牽引されてきた著名な研究者数名を交えて,この領域で今議論すべき問いに対しディスカッションを実施してまいります.前回に続き,今回もハイブリッド開催とし,オンラインと現地開催(東京会場)の両面から本企画を楽しんでいただけるように努めました. 尚,本企画開催にあたって,(株)LayerXさまの会場をご提供いただきました.

research-p.com

そのご縁もあり「研究コミュニティ cvpaper.challenge 〜広がる研究コミュニティー〜 Advent Calendar 2024」への寄稿をご依頼いただきましたので、バクラク事業部のAIや機械学習領域においてマネージャーを務めている機械学習エンジニアの松村(@yu__ya4)が執筆して 18日目の記事として公開しております。(24,25日はどなたの投稿になるのか楽しみですね!)

研究コミュニティ cvpaper.challenge 〜広がる研究コミュニティー〜 Advent Calendar 2024

本記事ではCCCW2024への協賛報告に合わせて、なぜLayerXが研究コミュニティのイベントであるCCCW2024へと協賛したのかの背景を簡単に紹介します。

前提としてLayerXは事業会社であり、研究組織があるわけでもありません。機械学習エンジニアは複数在籍していますが、業務は基本的にAIや機械学習分野の技術を活かしたプロダクト開発です。論文を書くということはありません。また、普段からAIや機械学習領域に関する発信はしているのですが、コンピュータビジョン分野の技術を深く活用しているイメージもまだ強くないようです。そのような背景もありCCCW2024の懇親会でも何名かの方から協賛の背景をご質問いただきましたので、その内容について記載しようと思いました。

そもそものきっかけ

cvpaper.challenge というコミュニティのことは昔から知っており、CVPR速報など質の高いレポートにはたびたびお世話になっています。ただ、イベントに参加したのは前回のcvpaper.challenge Conference summer 2024が初であり、cvpaper.challenge のHQであるFukuharaさんに誘っていただいたのがきっかけでした。

このイベントの裏側が以下のブログで紹介されています。普段研究活動をしているわけでない私でも懇親会までしっかり楽しませていただき、メンバーの皆様の研究活動への熱量に触れ、本当に素敵なコミュニティであるなと強く感じました。そして、FukuharaさんをはじめとするHQの方々とお話ししている中で次のイベントの会場を探しているという話題になり、それならばぜひLayerXでと申し出たのが今回の協賛のきっかけとなります。懇親会大事。

note.com

LayerXにおけるコンピュータビジョン分野の取り組み

LayerXは複数の事業部を有し、さまざまなプロダクトを展開しています。その中でも主要な技術領域の一つにドキュメント解析があります。たとえば、請求書受取サービスや経費精算サービスを提供する「バクラク」では、請求書や領収書などの書類から金額・日付・取引相手情報といった必要項目を自動的に抽出するAI-OCR機能を提供しており、顧客に大きな価値をもたらしています。

AI-OCR機能では、まず以下の例のような書類内のテキスト情報をOCR(光学文字認識)手法で取り出し、それを自然言語処理(NLP)の技術によって特定の情報へと絞り込むアプローチが一般的です。OCRはコンピュータビジョン分野を代表する応用領域のひとつであり、これがなければAI-OCR機能は成立しません。

ドキュメント解析とコンピュータビジョン分野との繋がり

しかし、必要な情報を的確に抽出するためには、単なる文字認識にとどまらず、コンピュータビジョン技術による多角的なアプローチが必要となります。たとえば、重要な金額は大きなフォントや太字、色付きで強調されている場合があります。また、取引相手を示すロゴや印影など、テキスト以外のビジュアル要素から情報を得るシーンも珍しくありません。さらに、多くの書類はテキストだけでなく、そのレイアウト(配置)によって意味付けが行われています。

こうしたテキスト認識では捉えきれない視覚的特徴(フォントサイズ、色、図像)やレイアウト情報を正しく理解するために、コンピュータビジョン分野の知見が不可欠となるのです。

加えて、印影が読みたいテキスト上に重なっている場合には印影を除去したり、スマートフォンで撮影した領収書が手ぶれや低解像度である場合にはその品質を補正するなど、さまざまな課題が存在します。これらの問題解決にもコンピュータビジョン技術が活用されています。

このようにLayerXのサービスにおける主要技術であるドキュメント解析においては、様々なケースにおいてコンピュータビジョン分野の技術を必要としており、コンピュータビジョン分野の技術は事業上重要なものと位置付けられています。その他、LayerXの、特にバクラクにおけるAI/ML技術活用に関する内容は、CCCWでも発表して紹介させていただいた以下の資料などを参照ください。

speakerdeck.com

中長期視点での技術研鑽とコミュニティ参加の意義

プロダクト開発において、現在利用中の技術に対する深い知見を獲得したり、他社・他者の経験から学ぶことは、言うまでもなく重要な取り組みです。多くの技術コミュニティ参加者と同様、LayerXも日々の業務やサービス改善に活かせるような基礎から応用までの技術研鑽を目的として、研究コミュニティやイベントに積極的に関わっています。

一方で、最新のトップカンファレンスで公開される cutting-edge な手法を直ちに自社プロダクトに適用できるケースは決して多くはないように思います。計算コストやレイテンシへの制約、継続的メンテナンスの難しさ、そもそも SOTA と言われるアプローチが自社固有のドメインで必ずしも高性能を示すとは限らないなど、乗り越えるべき課題は多々あります。しかし、「最新手法をそのまま使う」ことが難しくとも、そこに至るまでのアイデアや理論的背景が現在直面している課題や将来的に顕在化する可能性のある問題へのヒントになり得る点は見逃せません。

加えて、一度技術トレンドから目を離してしまうと、再度キャッチアップするには大きな労力と時間が必要になります。組織が中長期的な視点で定期的に研究動向を追い続けることで、必要な局面で迅速に最新知見をプロダクト開発に活かせる状態を維持できると我々は考えています。これは、一種の技術的な貯金のようなものであり、将来の不確定なニーズや市場変化に柔軟に対応するための戦略的備えであると考えて実践しています。

さらに、研究コミュニティへの参加は「今、目の前の業務」で必要としていない技術への出会いのきっかけにもなります。たとえば先日のCCCW2024では、Spatial AI と呼ばれるコンピュータが三次元空間を理解するための先端技術について学ぶことができました。正直なところ、今すぐ我々の事業領域でこの技術を直接用いる可能性は高くありませんが、こうした分野外の知見がいつか新たな発想を生み出すタネになるかもしれません。このようなセレンディピティ的な出会いに基づく中長期的なイノベーションの種まきを続けることは、結果的に企業の成長エンジンとなり得ると考えています。

LayerXでは、この「使うか使わないかわからないが、いつか役立つかもしれない」新しい技術やアイデアを継続的にインプットし続けることが組織としての強みになると信じており、社内でAIや機械学習領域に関する勉強会を毎週開催しています。各メンバーが選んだ論文や技術ブログについて発表し合い、その資料は外部にも公開しています。また、2025年には外部参加者を招いたオープンな勉強会の定期開催も予定しており、社内外での技術交流をさらに加速させられればと考えています。

jobs.layerx.co.jp

コミュニティ協賛と企業としての持続的な価値創出、徳の概念

協賛企業としてコミュニティに参加する背景には、正直、打算的な側面も存在します。企業として分野の専門家や研究者とのネットワークを自然に築くことができ、組織内外で技術への信頼感を育むことにもつながります。こうした積み重ねは将来的に研究開発へと踏み出す場合には重要な基盤となり、魅力的なエンジニアや研究者の方々が当社に興味を持ってくださるきっかけにもなり得ると考えています。

しかし、それと同等以上に私たちが重視しているのは「単に技術を利用する立場」を超え、「技術発展に寄与する存在」として行動することです。コミュニティに積極的に貢献し、その継続的な発展を支えることで、当社は恩恵を一方的に享受するのではなく、きちんと還元していきたいと考えています。

LayerXでは、社内外に公開している羅針盤で、企業としての行動指針を明確に示しています。その一つである「徳」という価値観は、長期的な視点で社会発展に貢献し続けること、短期的な利益至上主義に走らず、仲間や社会から信頼される行動を追求することを求めています。これは、アカデミアや技術コミュニティ、OSSコントリビューターといった存在から得た恩恵を、公正に返していくことへの強い意志でもあります。

LayerXの行動指針

コミュニティが活動を継続できるよう、金銭等の支援を行うことは現実的な手段の一つです。しかし私たちにとっては、それを超えて日々お世話になっている技術コミュニティを少しでも盛り上げ、発展に寄与したいという純粋な想いがあります。こうした考えが、全社的な取り組みとして積極的なコミュニティ協賛活動へとつながっており、今回のCCCW2024への協賛にも至りました。

CCCW2024懇親会後の記念撮影

最後に

LayerXが研究コミュニティのイベントであるCCCW2024に協賛したことをきっかけに、なぜ我々がコミュニティへの協賛活動に積極的であるのかの考えを簡単に紹介しました。引き続き様々な技術コミュニティの活動に貢献していきたいと考えています。

LayerXっていい会社だなと感じてくださった方は、(半年前なのですでに少し古いですが)以下の記事なども是非ご覧ください。中の人とも話してみたいと感じてくださった場合は、ぜひXのDM(@yu__ya4)やカジュアル面談募集ページからお申し込みください!

tech.layerx.co.jp