Google File SystemなどのGoogle インフラの上に作られた分散データベース。
複数のテーブル群をまとめる、 Relational DB とは違い、テーブルひとつが論理単位となっている。
Googleが提供する、検索をはじめ、Google Earth、Google Maps、Youtubeなどでも利用されている。
こんにちは。 Uzabase SaaS事業の開発チームに所属している掛川です。 私の所属しているチームではユーザーからの入力情報を履歴として保存したいという要件があり、大量の入力履歴を保存するためにGoogleのCloud Bigtableを採用しています。 RDBばかり触ってきた私は、初めてBigtableを一から構築、データの登録を行ってみて戸惑うことばかりでした。 本記事は、私と同じように初めてBigtableを使う方や使おうか検討している方に向けて「Bigtableの概要からテーブルの作成、Kotlinを使った簡単なデータの取得/登録APIの作成まで」を纏めました。 Bigtableに…
こんにちはソリューション技術部の中山です。 この度、Google Cloud 主催の G.I.G. Japan プログラム 第 6 期に参加させていただき、無事 Google Cloud Professional Cloud Developer 認定資格を取得し、修了することができました。 プログラム内容や、私がやった勉強内容などを共有させていただければと思います。 G.I.G. とは プログラム内容 Google Cloud エンジニアによる特別セッション 第 1 回 Google Cloud のサーバーレス プロダクトを一気に紹介! 第 2 回 Google Cloud のデータベース ソ…
G-gen の杉村です。2023年8月29日〜31日 (現地時間)、Google Cloud Next '23 が米国・サンフランシスコで開催されました。前回の記事では1日目の発表を扱いましたので、今回の記事ではそれ以外の発表等をご紹介します。 はじめに 開発の効率化 Jump Start Solutions GitLab との提携 Application Integration の GA インフラ C3A / C3D VM Titanium BigQuery と AI/ML BigQuery ML での生成 AI 利用 Feature Store の BigQuery 対応 BigQuery…
GCP勉強中のririです。 GCPは業務で触れる機会がほとんどないので、勉強中に学んだことをメモしていこうと思います。 今日は基本的なストレージについてまとめます。 その他の記事はこちら⬇︎ konomamaowaru.hatenablog.jp <GCP-PCA>#1.コンピューティングサービス <GCP-PCA>#3.ネットワーク <GCP-PCA>#4.管理サービス <GCP-PCA>#5.セキュリティ関連サービス <GCP-PCA>#6.その他コアサービス ストレージ そのほか覚えておくべきこと GCS Firestore SQL Transfer Appliance Storage…
こんにちは,株式会社 High Link で業務委託(副業)として働いている,機械学習(ML)エンジニアの柏木(@asteriam)です. High Link では,カラリア香りの定期便という toC サービスを提供していて,ML エンジニアは,データを武器にした非連続的な事業成長を支える技術開発を担っています.具体的には推薦システムや診断といった部分に ML が活用されています. ハイリンク 機械学習・データエンジニア向け 紹介資料 今回はよりサービス改善がしやすい環境にすべく,機械学習用 API(ML-API)と ML パイプラインの役割を分離させ,ロジック改善を回しやすい環境を作っている…
【QAチーム ブログリレー2日目】 こんにちは。猛暑のさなか仁左衛門の体調がいささか気になる、エンジニアリンググループ・マルチデバイスチームQAの前川です。 1月のエンジニアブログで紹介のありましたように、私がQAエンジニアとして所属するマルチデバイスチームは、各事業チームの展開サービスを横串でサポート・開発を行う横断チームにあたり、私はその中でm3.comアプリ、Web講演会アプリ、ToDo PlusアプリのiOS/Androidアプリとそのapiサーバサイド、Push通知のバックヤードなど、チームが関わるプロダクトの大半を担当しています。 多岐にわたるサービスを呼び出すアプリのテストは、時…
当記事は みずほリサーチ&テクノロジーズ × G-gen エンジニアコラボレーション企画 で執筆されたものです。 ビジネスにおいてデータ活用が重要なことは改めて記載するまでもありません。 大量のデータを高速に処理でき、スケーラビリティのある Bigtable は、より効率的かつ正確なビジネス上の意思決定に貢献できそうです。 また、高度で詳細な監査要件の求められる金融機関のシステムにおいてはログの蓄積・解析などでの利用も考えられそうです。 G-gen の片岩です。 当記事では Google Cloud のデータベースサービスである Bigtable を徹底解説します。 基本事項 Cloud Bi…
Dataplex(旧Data Catalog)によるデータカタログについてあれやこれやれやをまとめておいたポインタが欲しくなってきたので、とりとめもなくつらつらと書きます。 注意点: BigQuery on GCPの運用を前提に書いてます Dataplexはデータカタログ以外の機能もたくさんありますが、データカタログの観点にフォーカスして書いてます 論理的なデータ構造を作成したり、それに基づいた権限管理など 少人数のチームでデータ基盤を運営しており、データカタログの運用自体に工数をなかなか割けない前提で書いてます 自前で作ることも難しいし、ましてそれを継続的に運用するのはさらに難しい 「データ…
やったー Google Cloud の主催する Google Cloud Innovators Gym Japan (G.I.G) というプログラムに参加して取りました。 Google Cloud を利用する企業を対象とした招待制のプログラムで、参加すると関連する Coursera コースへのアクセス、試験を受けるためのサポート、Google Cloud エンジニアの方によるハンズオンや質問できる機会が提供されます。 バッジ 以下の資格が対象。今回のプログラムは4月中頃に始まり、7月中頃までに Coursera のコースを終え合格報告をするスケジュール。お話を頂いて良い機会なのでチームの若者を…
G-gen の杉村です。当記事は BigQuery について徹底的に解説する記事の応用編です。BigQuery に初めて触れる方はまずは基本編の記事を、ぜひご参照ください。 基本編の記事 外部データ連携の概要図 外部テーブル 外部テーブルとは 用途 Cloud Storage 外部テーブル Google ドライブ外部テーブル Bigtable 外部テーブル 連携クエリ (Federated query) BigQuery Omni BigQuery Omni とは 対応サービス 注意点 BigLake BigLake とは データソース 通常の外部テーブルとの違い 利点 権限の持たせ方 Big…
G-gen の杉村です。Google Cloud のフルマネージドな分析用データベースである BigQuery について、徹底的に解説します。当記事は基本編であり、当記事を読み終わったあとは応用編もご参照ください。 概要 BigQuery とは 利用方法 フルマネージド (サーバーレス) 他の Google Cloud サービスとの連携 他クラウドサービスとの連携 料金 料金体系の基本 ストレージ料金 ストレージ料金の基本 Physical Storage と Logical Storage Active Storage と Long-term Storage コンピュート料金 無料枠 コンポ…
gPRC: Protocol Buffers スタイル規約 & API ベストプラクティスまとめ ファイル & パッケージ構成 Message Field Nested Type Any Enum Service Proto ベストプラクティス API ベストプラクティス フィールドとメッセージを正確かつ簡潔に文書化する Wire (≒API?)と Storage でメッセージを使い分ける Mutations (更新 API) の場合、データの完全なリプレイスではなく、部分的な更新または追加のみの更新をサポートする トップレベルのリクエストまたはレスポンスの proto にプリミティブ型(基本…
この記事の趣旨 2020年に発表されたBigQueryの元となったGoogle内で利用されている分析向けデータベースであるDremel の実装を解説した論文を読みました。 Dremel: A Decade of Interactive SQL Analysis at Web Scale 著者について Sergey Melnik, Andrey Gubarev, Jing Jing Long, Geoffrey Romer, Shiva Shivakumar, Matt Tolton, Theo Vassilakisら2010年のDremel発表論文の著者らと、 Hossein Ahmadi, …
Google Cloud (旧称 GCP) の 学習に役立つオンラインコンテンツ をサービスカットや分野別でまとめました。Google Cloud の基本的な学習のほか、資格取得にも役立つコンテンツ集となっておりますので、お役立てください。 はじめに Google Cloud 全般 課金・コスト削減 アーキテクチャ・ベストプラクティス セキュリティ・統制 コンピューティング ネットワーク ストレージ データベース データ分析 AI / ML (機械学習) 開発・IaC 監視・運用・SRE その他・Google プロダクト Google Workspace Google Cloud 認定資格 は…
概要 Bigtableは数十億行、数千列規模に拡張可能な分散型NoSQLですが、 特定のカラムファミリのみ持つ行を全て抽出する といった時にcbt(CLIツール)やSDKではiterateしてデータをハンドリングするため、大規模データ分析の用途では使いづらさがあります。 そこでBigQueryの外部テーブルとして扱うことで、SQLを用いて簡単に条件に基づいたデータのみ抽出することが可能になります。 外部テーブルの作成 環境 以下の環境であると仮定して進めます。 項目 設定値 GCPプロジェクト project-a Bigtableインスタンス bigquery-access-test Bigt…