企業の基盤となる高精度なデータコンテンツを構築
長年の蓄積データは慎重に取り扱う必要があります。住所が市区町村合併後の正しい住所になっていない、社名変更に対応していないなど、実際にデータを診断すると想像以上にデータが整備されていないことに驚かされます。
新商品のPR、休眠顧客の掘り起こしに既存の顧客データを活用しようと考えた時に、そのままでは使えないデータはどれだけあるのかを正しく把握することが大事です。
例えば、そのままダイレクトメールを発送した場合、不達、誤配送、二重送付、間違いなどにより、マーケティングをしたつもりが個人情報の漏洩など、重大なトラブルを引き起こしかねません。クレンジングを行うことで、マーケティングに使用できる顧客データが分かり、必要な情報だけを利用し、無駄なコストを削減することができます。
『Valu∞』のデータクレンジングは貴社のデータを調査し、最終的に利用する形に最適な手順で最適化します。処理手法は、ワンパターンでなく、データによりさまざまです。サンプル調査をもとに電話番号や郵便番号の欠如などのパターンを洗い出し、クレンジング(標準化)処理のルールを決定します。
フォーマットの標準化で精度が大幅にアップ
登録フォーマットが異なるデータを、各種辞書類を用いて貴社でのデータ活用に最適なフォーマットに一元化します。データ整備を行うことで活用範囲が大幅に向上します。
住所のクレンジング(再フォーマット、間違い訂正、不完全な住所の補完)
住所の誤登録や欠如している情報を付与し、最新の正しい住所に変換します。
また、下記のような細分化した住所フォーマットに変換することで、名寄せ処理時の同一データの判定精度が向上します。お客様へデータを納品する際は、貴社システムの入力フォーマットに準じた住所の結合や分割が可能です。
住所が不明の情報に関しても、電話番号が分かれば電話帳データベースから住所を付与することが可能です。
| 郵便番号 | 住所1 | 住所2 | 住所3 | 住所4 | 説明 |
|---|---|---|---|---|---|
| 430-0928 | 静岡県 | 浜松市中区 | 板屋町 | 111−2 | 目的のフォーマット |
| 430-0928 | 静岡県 | 浜松市 | 板屋町 | 111−2 | 市区町村統廃合に未対応 |
| 430-0928 | 静岡県 | 浜松市中区 | 板屋町111−2 | 住所の結合 | |
| 430-0928 | 静岡県 | 浜松市 | 中区板屋町 | 111−2 | フィールド違い |
| 430-0928 | 静岡県 | 浜松市中区 | 板谷町 | 111−2 | 入力ミス |
| 430-0928 | 静岡県 | 浜松市中区 | 板屋町 | 111番地2号 | 丁目・番地の記述 |
| 430-0928 | 静岡県 | 浜松市中区 | 板屋町 | 111-2 | 全角半角の違い |
| 430-0928 | シズオカケン | ハママツシナカク | イタヤマチ | 111−2 | カナ表記 |
| 430-0928 | 浜松市中区 | 板屋町 | 111−2 | 都道府県なし | |
| 静岡県 | 浜松市中区 | 板屋町 | 111−2 | 郵便番号なし | |
| 430-0982 | 静岡県 | 浜松市中区 | 板屋町 | 111−2 | 郵便番号と住所の不一致 |
| ↓↓↓ 全てを同一住所に変換 ↓↓↓ | |||||
| 430-0928 | 静岡県 | 浜松市中区 | 板屋町 | 111−2 | |
法人名の『ゆれ』を吸収、企業合併や社名変更に対応、姓名分割
顧客登録の際、法人名の入力規則が決められていない場合、同一の会社であっても、担当者によって異なる名称で登録するケースがあります。そのような場合、データ検索時に漏れが発生したり、重複してカタログ発送をしてしまうなどのトラブルが発生することがあります。
また、入力時点では正しかった名称が、企業合併や社名変更により、現在の正しいものと異なる場合があります。そのようなケースでも法人名辞書を用いて法人名の『ゆれ』を吸収します。あわせて、法人名と部署が結合している場合は、分割処理することも可能です。
個人名の処理は、新字体(新漢字)、旧字体(旧漢字)、異体字の混在を統一したり、姓と名の間のスペース有無の使い方を統一することが可能です。姓と名の間に区切りが無い場合でも、姓名辞書を用いて姓と名の分割処理が可能です。
また、姓名分割は姓名辞書を使用した単純なものではなく電話帳に存在するデータを使用するため、下記のように姓名の分割が難しい名前であっても正しく分割が可能です。
例)東藤一郎 … 藤一郎(あずま とういちろう) と 東藤 一郎(とうどう いちろう)
例)加賀美智子 … 加賀 美智子(かが みちこ) と 加賀美 智子(かがみ ともこ)
| 名称 |
|---|
| FIA |
| F・I・A |
| エフアイエー |
| エフ・アイ・エー |
| ↓↓↓ 全てを同一名称に変換 ↓↓↓ |
| F・I・A |
| 名称 |
|---|
| 第一勧業銀行 |
| 富士銀行 |
| 日本興業銀行 |
| みずほ銀行 |
| ↓↓↓ 全てを同一名称に変換 ↓↓↓ |
| みずほ銀行 |
| 名称 | 説明 |
|---|---|
| 鈴木一郎 | 区切り文字なし |
| 鈴木 一郎 | スペース区切り |
| ↓↓↓ 姓名を分割 ↓↓↓ | |
| 姓 | 名 |
| 鈴木 | 一郎 |
| 名称 | 説明 |
|---|---|
| 日本ソフト販売株式会社営業部 | 区切り文字なし |
| 日本ソフト販売株式会社 営業部 | スペース区切り |
| ↓↓↓ 部署を分割 ↓↓↓ | |
| 会社名 | 部署名 |
| 日本ソフト販売株式会社 | 営業部 |
日付フォーマットの標準化
日付の入力規則が決められていない場合、担当者によりさまざまな形式で登録されているケースがあり、いざデータを抽出しようとした時に、目的の情報が抽出できないケースがあります。日付フォーマットを統一することでそのようなトラブルは簡単に避けることが可能です。
| 日付 | 説明 |
|---|---|
| 2012/01/25 | 目的のフォーマット |
| 平成24年1月25日 | 和暦 |
| 2012/1/25 | 先頭にゼロなし |
| 20120125 | 区切りなし |
| 25, 1, 2012 | システムログ等各種 |
| 25-01-12 | |
| 01.25.12 | |
| January 25, 2012 | |
| ↓↓↓ 全てを同一形式に変換 ↓↓↓ | |
| 2012/01/25 | |
電話番号の使用状況から通話可能か検出 ※オプション
国内で流通している電話番号約1億2,500万件の使用状況データベースを搭載。顧客の住所変更の可能性を予測し、クリーンな顧客データベースを作成します。「通話可能」「通話不可能」「番号案内取得」など、お客様の目的に応じて、必要な結果を判別できるデータベースをお選びいただけます。 ※株式会社ジンテックが提供するサービスです。