LayerX エンジニアブログ

LayerX の エンジニアブログです。

データ基盤

SnowflakeにCOPY INTOでバルクロードする際のポイント #ベッテク月間

Amazon S3 / Google Cloud Storage にある大量・巨大なファイルを COPY INTO で Snowflake へデータロードする際に押さえておくべきポイントを備忘録的に記しておきます。 前提となるデータロード 以下のようなユースケースにおけるCOPY INTO の利用を想定し…

LLM時代のデータ基盤 : 非構造化データを扱うETLプロセスの重要性 #ベッテク月間

こんにちは!LayerXのバクラク事業で機械学習・データ周りを担当しております、たかぎわ (@shun_tak) と申します。 みなさま、ChatGPTの登場に衝撃を受け、これを日々の生活やビジネスに活用されていることかと思います。わたしも社内でChatGPT活用の勉強会…

SIEMからデータ基盤へ - Amazon Security Lakeを試してる話

LayerX Fintech事業部*1ので、ガバナンス・コンプラエンジニアリングをしている @ken5scal です。 はじめに 本ブログは、以前執筆した「SIEMの限界」から「データ基盤への道」への具体的な取り組み、いわば試行錯誤の途中経過をお伝えするものです。今後も継…

Google ドライブにある Excel ファイルをシュッと BigQuery にロードしたときの備忘録

こんにちは。機械学習・データ部の @irotoris です。 どこからかダウンロードしてきた Excel ファイルのデータを BigQuery に入れてほしいという話があり、Python と pandas で Excel を読み込んでシュッと BigQuery にロードしたときの作業備忘録です。 TL;…

データ領域におけるイネーブリング活動を10か月やってみた報告と今後の課題 #LayerXテックアドカレ #のびしろウィーク

今年の2月にデータイネーブリングはじめますという宣言をしました。 note.com また、こちらの記事にもチーム設立の背景や課題についてまとめています。 tech.layerx.co.jp 10か月活動してみて、いろいろと解像度が上がってきたので、一度まとめておこうと思…

バクラク事業部による AWS コスト管理の課題に対して行った3つの取り組み

こんにちは!バクラク事業部 Platform Engineering 部 DevOps チームの多田(@tada_infra)です。7月はLayerX エンジニアブログを活発にする期間でして、ぜひ左記のリンクを辿って気になる記事を見ていただけるとありがたいです!先週の金曜日は Natsuo さんの…

バクラク事業におけるデータ組織とデータ基盤 2023

お世話になっております。LayerXの高際 @shun_tak と申します。現在は、データ分析組織の立ち上げに注力しています。 本記事では、バクラク事業におけるデータ組織とデータ基盤をテーマに取り扱います。データ分析における認知負荷や属人性を解消するための…