東京都
SHAP: 機械学習モデルが出力する個別の予測値の理由を説明する
機械学習モデルを解釈する手法の一つに「予測モデルの特定の出力値がどの特徴量によってもたらされたのか」を計算するSHAPがあります。SHAPの計算方法やPythonによる実行例、利点と注意点などを説明します。続きはこちらから。
dbtを使った数値型カラムのDATE型変換とテーブル自動生成の手順
データパイプラインで、数値型カラムからDATE型へ変換し、常に最新の変換済みデータを持つテーブルを維持するシステム構築について、dbtでの実装方法を紹介します。続きはこちらから。
【最速レビュー】BigQueryデータ準備(Introduction to BigQuery data preparation)を使ってみた
GoogleCloudの新機能である「BigQueryデータ準備(Introduction to BigQuery data preparation)」。この記事では、この機能を実際に試してみた体験を基に、その使い方と感想をお届けします。続きはこちらから。
【機械学習】異常検知入門
機械学習分野の一つとして異常検知が大きく注目を集めています。異常検知とは、データを基にした客観的な基準により、正常なデータから外れるデータを検出すること。正規分布を仮定するホテリング理論について記載します。続きはこちらから。
【Python】Webアプリのデプロイに関する比較調査
Pythonでアプリを開発する際には、最適なデプロイ方法を検討することが重要です。Flask、FastAPI、Streamlit、Djangoといった代表的なフレームワークを比較し、それぞれの特徴や適用シーンを詳しく解説します。続きはこちらから。
dbt seedを使ってSnowflakeへローカルデータをロードしてみよう
データ分析基盤としてSnowflakeを使用している場合、dbtを使うことでデータパイプラインの構築がより簡単になります。dbt seedコマンドを利用してローカルのCSVファイルをSnowflakeにロードする方法を解説します。続きはこちらから。
SnowflakeのコストをSlackに通知する方法
Snowflakeを利用する際、コスト管理は非常に重要です。SlackとSnowflakeの連携により、日次・月次のコストをチーム全体で素早く確認でき、予算超過を防ぐ効果が期待できます。続きはこちらから。
HTAPデータベースとは?OLTPとOLAPを超える次世代のリアルタイム分析基盤
現代のビジネスでは、リアルタイムのデータ分析が求められています。データ量の増加やリアルタイムでの意思決定が必要な場面が増え、トランザクションデータを即座に分析できるシステムが求められるようになっています。続きはこちらから。
画像分類の鍵!Transformsの役割と種類
Transformsは、画像分類においてなぜ重要なのか?その役割と効果的な活用法を解説します。続きはこちらから。
Looker Studioでデータの反映に時間がかかる時の対処法
Looker Studioでデータ反映が遅い原因がBigQuery接続にある場合の対処法を紹介。テーブル再作成やUNIONテーブルの接続方法を解説し、反映速度を改善します。続きはこちらから。
Looker Query Insights の実装方法について
Looker Query InsightsはExplorerでのクエリに対してインサイトやデータに関する要約を出力する機能です。 拡張機能のデプロイ方法と、バックエンドが構築済みの前提でフロントエンドの展開に必要な手順について解説します。続きはこちらから。
SnowflakeのGUIで権限を付与する方法
Snowflakeでは、ユーザーやロールに対して権限を簡単に管理・付与できるGUIが提供されています。この記事では、SnowflakeのGUIを使って、特定のロールやユーザーに権限を付与する手順をステップごとに解説します。続きはこちらから。
BigQueryでフィードバックを翻訳ML.TRANSLATE関数の利用
本記事では、Google Cloud上でBigQueryとCloud Translation APIを接続し、USリージョンでの製品フィードバックデータを日本語に翻訳し、結果を新しいテーブルに保存する方法を紹介します。続きはこちらから。
Permutation Importance: 機械学習モデルを「特徴量の重要度」から解釈する
ビジネスで機械学習モデルを活用する場合に、ブラックボックスなモデルの挙動を解釈することが必要なあ場合があります。特徴量の重要度という観点から解釈する「Permutation Importance」について解説します。続きはこちらから。
Looker Dashboard Summarizationを構築する方法
Looker ダッシュボードサマリ化拡張機能は、Vertex AI の大規模言語モデルを活用し、 ダッシュボードのデータをリアルタイムで要約する拡張機能。 WebSocket を利用し、ストリーミングダッシュボードのサマリ生成を実現します。続きはこちらから。