バクラク事業部OCR/MLチームのリーダーを務めております機械学習エンジニアの松村(@yu-ya4)です。LayerXは、DEIM2023(第15回データ工学と情報マネジメントに関するフォーラム)にプラチナスポンサーとして協賛いたします。
また、技術報告としてバクラクシリーズのAI-OCR機能についての発表や、DBSJ学生企画のナイトセッションにおける企業パネルディスカッションにおける登壇も予定しております。さらに、現地開催となる4、5日目は私を含む数名のメンバーで会場を訪れ、データベース界隈の皆様との交流を深めさせていただければと思っておりますので、何卒よろしくお願い致します。
DEIM2023概要
DEIM(データ工学と情報マネジメントに関するフォーラム)は、コンピュータサイエンスに関する幅広い研究トピックについての議論・意見交換を目的として開催される研究会です。検索や推薦、画像認識や自然言語処理といった特定の技術領域を切り口としたテーマのものから、医療や教育など特定のドメインに関するもの、SNS上のデータや地理データなど特定の性質のデータに関するものなど様々なテーマについての研究が発表されます。
例年合宿形式で行われており、異なる研究領域の方どうしや、学生・研究者・企業の開発者など異なる背景の人たちどうしがざっくばらんに交流できるというのがDEIMの大きな魅力の一つですが、昨今の情勢を鑑みて2020年から2022年にかけては完全オンラインの形式にて開催されていました。一方で今年のDEIM2023では withコロナ時代の新たな試みとして「直列ハイブリッド形式」での開催が予定されています。直列ハイブリッド形式とは、一般発表(1日目〜3日目)をオンラインで行い、4日目と5日目はオフライン会場に集まってチュートリアルやポスター発表を中心としたネットワーキングイベントを行うものです。
- 日程 : 2023年3月5日(日)〜 3月9日(木)
- オンライン会場: DEIM2023 オンライン会議ポータル(1日目〜3日目)
- オフライン会場:長良川国際会議場(4日目、5日目)
- 主催: 日本データベース学会、データ工学研究専門委員会、データベースシステム研究会
- 公式サイト: event.dbsj.org
協賛の背景
LayerXのバクラク事業部では、法人支出管理SaaSとして非常に好評いただいている「バクラク請求書」や「バクラク経費精算」など現時点で4つのプロダクト群からなるバクラクシリーズの開発をしております。これらの製品を通じてお客様に「圧倒的に使いやすいプロダクトを届け、ワクワクする働き方を」提供すべく、画像認識や自然言語処理、情報推薦といった技術を積極的に活用し、研究・プロダクト開発に取り組んでいます。
我々LayerX の掲げる行動指針である「Bet Technology」や「徳」の観点から、アカデミアやOSSコントリビューターの成果から一方的に恩恵を受けるだけでなく、アカデミアや技術コミュニティへの貢献を継続して行っていきたいと考えています。
その上で、国内でも最大級の規模でアカデミアや企業の学生、研究者、開発者など様々な背景の方が集まり、幅広いトピックについて研究発表、議論、交流がなされるDEIMへと貢献することは、同様に様々な背景のメンバーが集まって幅広い技術領域における開発を進めるLayerXにとっても、そして社会の発展にとっても大変有益なことであると考えており、今回プラチナスポンサーとしてDEIM2023に協賛させていただくこととしました。
登壇等情報
LayerXではDEIM2023の協賛に伴い、私を含めた数名のメンバーでの聴講および登壇等での参加を予定しております。新しい形式のDEIMを盛り上げる一助になれれば幸いです。
技術報告
3日目の画像認識のセッションにて、LayerX バクラクシリーズの請求書OCR機能の開発に関して技術報告いたします。是非ともご聴講ください。
- 題目:『 LayerXにおける機械学習を活用した請求書OCR機能に関する取り組み』
- 日程:3/7(火)13:30-15:40(4a-8: 画像認識2)
- 発表者:松村 優也、吉田 陽祐
- プログラムリンク:https://deim-management-system.github.io/deim2023_program/index.html#4a-8
発表概要
LayerX は「働く」に関わる様々な業務プロセスが紙とハンコを中心としたアナログで非効率なものとなっているという課題を、テクノロジーをもとに解決するために複数のプロダクトを開発・運営している。その中のひとつ「バクラク請求書」では、アップロードされた請求書ファイルから自動で必要な情報を抽出しデータ化するOCR機能を提供している。このOCR機能の実現には、画像処理や自然言語処理などの機械学習技術を活用している。本発表では、OCR機能の開発に際してどのように機械学習技術の活用を行なっているのか、どのような技術的課題が存在するのかを紹介する。
学生企画
1日目(3/5)の夜に予定されているDBSJ学生企画のナイトセッションにおける企業パネルディスカッションに松村が登壇させていただきます。DEIMで例年開催されているカジュアルな座談会枠に当たるセッションであり、私自身は昨年も登壇の機会をいただき楽しい時間を過ごさせていただきました。ざっくばらんに参加企業の開発や研究などへの取り組み、働き方が知れる良い機会となりますので、是非とも参加をご検討ください。
- 日程:3/5(火)19:00-20:00(学生企画)
- 発表者:松村 優也
- プログラムリンク:https://event.dbsj.org/deim2023/post/event_nightsession.html
現地参加
直列ハイブリッド形式での開催に伴い、私を含む数名のメンバーで現地会場にも参加させていただきます。ネットワーキングイベントへの参加やブース出展も行います。ブースでは技術報告では話しきれなかった我々の取り組みについてや、その他LayerXについてなんでもざっくばらんにお話しさせていただければと思いますので、是非ともお気軽に訪れていただけると嬉しいです。
さいごに
LayerXとしてDEIMに参加するのは初めてのことですので、是非ともたくさんの方々と交流できればと考えております。また、私個人としては学生時代より長くDEIMには関わらせていただいており、本年も参加できることを非常に嬉しく思っております。参加者の皆様とお会いできるのを楽しみにしております。よろしくお願い致します!