Skip to Content Treasure Data Logo Treasure Data Logo
  • 製品
    • エージェンティック・エクスペリエンス・プラットフォーム
      • Treasure AIが選ばれる理由
      • エージェンティック・エクスペリエンス・プラットフォームAgentic Experience Platform
      • 料金体系
      • 信頼とセキュリティ
    • AI層
      • Treasure AI Studio
      • Treasure AI Voice
      • AIエージェント一覧AI Agents Hub
    • アクティベーション層
      • Treasure AI Suiteチャット形式でデータ分析からレポート作成、施策実行が完了します
      • Engagement AI SuiteエンゲージメントAI機能
      • Creative AI SuiteクリエイティブAI機能
      • Personalization AI SuiteパーソナライゼーションAI機能
      • Paid Media AI Suite広告AI機能
      • Service AI SuiteサービスAI機能
    • コンテキスト層
      • カスタマーデータプラットフォームCustomer Data Platform
      • コンポーザブルCDPComposable CDP
      • データ連携
  • ソリューション
    • 業界
      • 自動車・モビリティ
      • 消費財(CPG)
      • エンタメ・メディア
      • 金融・銀行
      • 医療・製薬・ヘルスケア
      • 小売・リテール
      • IT・テクノロジー
      • 旅行・ホテル
  • 事例/顧客
    • 導入顧客・事例一覧
    • 海外事例・グローバルビジネス
  • ナレッジ
    • ナレッジ
      • ブログ
      • トレジャーアカデミー
      • 技術ドキュメント
    • はじめての方へ
      • 料金
      • 無料相談
      • シュミレーション (英語)
  • 企業情報
    • トレジャーAI
      • トレジャーAIについて
      • 最新情報まとめ
      • プレスリリース
      • 掲載情報
      • 採用情報
      • プロフェッショナルサービス
      • パートナー
      • お問い合わせ
ログイン
無料相談
  • Menu Item 1
    • Sub-menu Item 1
      • Another Item
    • Sub-menu Item 2
  • Menu Item 2
    • Yet Another Item
  • Menu Item 3
  • Menu Item 4
ブログ
    • Treasure in Talk
    • キキタイ!データラボ
2021/03/26

機械学習における予測モデルの作り方

Treasure AI Treasure AI

機械学習とは「データから規則性や判断基準を学習し、それに基づき未知のものを予測、判断する技術」と人工知能に関わる分析技術を指しています。

Treasure Data CDPも、機械学習を用いて予測モデルを生成する機能「Predictive Scoring」や機械学習の分野で最もシェアが高いプログラミング言語のPythonを実行できる「Custom Script」を持っており、特定行動をする可能性のある顧客を予測することができるようになります。

ただし当然ながら、大量のデータがあればすぐに精度の高い予測モデルが作られるわけではありません。そこには、予測モデルを開発するためのプロセスが存在します。どのようなプロセスで開発されるのでしょうか。トレジャーデータのデータマネジメントチームで統計モデルの開発・実装を担当している小野が解説します。

小野 岳洋
小野 岳洋

トレジャーデータ株式会社
Data Management

2020年にトレジャーデータに参画。データマネジメントチームにて、Treasure Data CDPの導入・構築・運用、統計モデルの開発・実装を担当。得意領域は機械学習を含めた統計モデル開発

予測モデルとは

予測モデルとは、顧客の購買確率予測や集客予測に利用される統計モデルです。購買確率を予測することで営業先の優先順序を決定したり、集客人数や機械の故障率を予測することで社内のリソースを管理したり、解約率を予測することで将来の収益を推測したりします。近年はAIや機械学習の発展や多量のデータを扱うことにより、その精度を大幅に向上させることができています。

予測モデルは、入力側のデータを入れると予測結果が出力される構造になっています。予測には数値予測、確率予測、カテゴリ予測などがあり、例えば以下のような構造になっています。

入力から出力への流れを矢印で示し、入力データの種類ごとにモデルと出力結果が対応。 個人属性データ(年齢、性別、会員情報など) → 確率予測モデル → 購買確率。 ウェブログデータ(行動履歴、購入履歴など) → 数値予測モデル → 集客人数予測。 アンケートデータ(興味がある商品、購入検討時期など) → 数値予測モデル → 集客人数予測。 営業実績データ(営業先、購買先など) → カテゴリ予測モデル → 会員属性予測。

機械学習は予測モデルのアルゴリズムとして使われることが多く、そのモデル開発は開発者の流儀や使用するアルゴリズムなどの違いがあるため、誰もがいつも同じプロセスを踏むわけではありません。下記では、私が踏んでいる手順の大枠を説明します。

予測モデルの開発プロセス

  1. モデル概要の定義
    ビジネスにおけるモデルを開発する意義や機能、アルゴリズムや開発手順を定義します。例えば「営業戦略に利用するため、ロジスティック回帰を利用し購買確率予測モデルを作成する」などです。特に、モデルの対象範囲や責任範囲が定まっていないと、出戻りする場合や議論の収拾がつかなくなる恐れがあります。
  2. データの準備 ー探索的データ分析(EAD)、データ精査
    データを俯瞰し、構造を把握します。また、利用するデータが正しく格納されモデル開発に利用できるかを確認します。定義通りに格納されているか、欠損が多すぎないか、異常値はないか、分布が現場との感覚に沿っているかなどを整理します。 テーブル一覧、ER図、要約統計量、欠損や異常値の割合などを作成します。
  3. データの作成
    1. 分析テーブルの作成
      2で確認した内容をもとに、データを結合し、使えない項目を削除し分析用のテーブルを作成します。
      1で定義した要件を満たすよう目的変数を定義し結合します。
    2. 変数の加工、取捨選択
      説明変数となる項目とその離散化や合成変数を作成し、目的変数への説明力を分析し、カテゴリの数を調整します。
      パターンにより使える変数が異なる場合など、モデルを分割する必要があるかも確認します。
  4. モデル構築
    1で定義したひとつ、または複数のアルゴリズムでモデルを構築します。 トレーニング用と検証用にデータを分割し、両方の精度を見ながらアルゴリズムとパラメータを選択します。
  5. モデル評価
    5で構築したモデルが実利用に則しているかを検証します。 主要な変数、安定性、ロバスト性(堅牢性)、特定変数への依存、出力の分布の偏り、実績や新旧モデル出力の差、実利用に沿っているか、モデルを導入した際のコストパフォーマンスなどを確認します。

おわりに

今回は、私が行っている予測モデル開発のプロセスを大枠で解説しました。プロセスの概要を掴んでいただけたら幸いです。

Share this story:


Subscribe
Get Treasure Data blogs, news, use cases, and platform capabilities:

Thank you for subscribing to our blog!

Recent Posts

Treasure in Talk 1 min read 2026.6月.01
#26 MMM|新商品開発と後発戦略、トレンドは?
1 min read 2026.5月.28
手軽に実現!Ponta購買データ×LINE分析
Treasure in Talk 1 min read 2026.5月.25
#25 MMM|デジタルで伝えるメッセージ、気を付けることは?
トレジャーデータ
スポークスパーソン
吉田麻也氏
maya-yoshida-top-fotter

顧客データの統合・活用にお悩みの方は、お気軽にご相談ください

顧客データの統合・活用にお悩みの方は、お気軽にご相談ください

「そのMA、本当に顧客を『動かせ』ていますか?」

CDP+AIが実現する最先端の次世代MAを徹底的に解説します。

無料ダウンロード
無料相談ルーム

導入・運用の疑問や不安をオンラインでお気軽に解消いただけます。

相談を予約する
お問い合わせ

その他、ご不明点などお気軽にお問い合わせください。

問い合わせる
Treasure Data Logo Symbol

+1 866.899.5386 (US)
+1 650.772.4500 (Non-US)

  • 製品
    • エージェンティック・エクスペリエンス・プラットフォーム
      • Treasure AI が選ばれる理由
      • エージェンティック・エクスペリエンス・プラットフォーム
      • 料金体系
      • 信頼とセキュリティ
    • AI層
      • Treasure AI Studio
      • Treasure AI Voice
      • AIエージェント一覧
    • アクティベーション層
      • Treasure AI Suite
      • Engagement AI Suite
      • Creative AI Suite
      • Personalization AI Suite
      • Paid Media AI Suite
      • Service AI Suite
    • コンテキスト層
      • カスタマーデータプラットフォームCustomer Data Platform
      • コンポーザブルCDP
      • データ連携
  • ソリューション
    • 業界
      • 自動車・モビリティ
      • 消費財(CPG)
      • エンタメ・メディア
      • 金融・銀行
      • 医療・製薬・ヘルスケア
      • 小売・リテール
      • IT・テクノロジー
      • 旅行・ホテル
  • 事例/顧客
    • 導入顧客/事例一覧
    • 海外事例・グローバルビジネス
  • ナレッジ
    • ナレッジ
      • ブログ
      • トレジャーアカデミー
      • 技術ドキュメント
    • はじめての方へ
      • 料金
      • 無料相談
  • 企業情報
    • トレジャーAI
      • トレジャーAIについて
      • 最新情報まとめ
      • プレスリリース
      • 掲載情報
      • 採用情報
      • プロフェッショナルサービス
      • パートナー
        • パートナー専用ページ
      • お問い合わせ
      • プライバシーハブ
  • 無料相談
  • 個人情報保護方針
  • 個人情報に関する公表文
  • インフォマティブデータの取扱いについて
  • よくあるご質問
  • プライバシーハブ
  • Terms of Service
  • Cookie Policy
  • Trademarks
  • Modern Slavery Statement
  • Your Privacy Choices
©2026 Treasure Data, Inc. (or its affiliates) All rights reserved.