
AI向け独自データを保有の関連銘柄
Written by
KabuMart調査日:2026年04月12日
AI向け独自データを保有の全体像
AI向け独自データを保有について
「AI向け独自データを保有」とは、企業や組織が一般には公開されていない自社固有のデータ(機密情報、顧客データ、専門知識など)を、AIの学習や運用に活用できる状態で持っていることを指します。汎用的なAI(例:ChatGPTなど)の普及により、他社と差別化するための競争力の源泉として、独自データの重要性が高まっています。 独自データを用いることで、社内特有のルールや専門用語に即した回答精度の向上、公開データでは得られない現場知見の活用による模倣困難性の強化、整理された高品質データによる誤回答の削減などが期待されます。
AI向け独自データを保有の社会的影響
- 模倣困難な「競争優位性」の確立(独自データで学習・最適化し、他社には真似できない高精度な予測や判断につながる)
- ブラックボックス回避の一助(自社データに基づく分析により現場のボトルネック解消や戦略立案を支援)
AI向け独自データを保有のリスク
- セキュリティ/情報漏洩リスク(入力データが意図せず学習に取り込まれ、他者の回答として出力されるリスクなど)
- データ汚染(ポイズニング)攻撃によるリスク(外部から悪意のあるデータが学習プロセスに影響する可能性)
- 法的・倫理的リスク、運用コスト増(独自データ活用にはセキュリティ、法的・倫理的、運用コストの3側面でリスクがある)
AI向け独自データを保有の課題
- データの量と質の確保(独自データの活用における主要課題)
- セキュリティと法規制への対応(管理・運用に必要な対応が課題になる)
- 高度な人材とコスト(データ活用には人材確保とコストが必要)
- データの正確性やバイアスへの懸念(AI導入における懸念として言及あり)
関連銘柄を網羅的に紹介します。
ソケッツ(5267)
AI向け独自データを保有における役割
音楽・映画・書籍などの独自メタデータを保有し、AIによる感性検索やパーソナライズ推薦の基盤データを提供
AI向け独自データを保有における強み
- 人間の感性や感情を解釈することに特化した「感性メタデータ」と呼ばれる独自のエンターテインメント・データベースを保有(音楽・アニメ・映画・コミック等で、物語・エモーション・価値観などをデータ化)
- 音楽・アニメ・映画・ドラマ・コミックなどのコンテンツデータベースを開発し、コンテンツ専門データとしてサービス提供している
- 「感性メタデータ生成サービス」において、独自のクローリング技術で必要な情報のみを高い精度で収集し、専門辞書を用いてデータ化
- 感性AIの実現に向けて、蓄積しているドメイン特化データベースと生成AIなどのAI技術を活用している
- メディア・エンターテイメント企業51社での活用実績がある(アップセル推進の記載)
- グローバルな歌詞データについて、900万を超える歌詞データに対するライセンスを持つLyricFindとのパートナーシップがある
AI向け独自データを保有におけるリスク
- 急速に進化する汎用的な生成AI(ChatGPTなど)の普及により、競争激化とソケッツへの事業リスクとなり得る
- 生成AI活用における機密情報・個人情報の漏えいリスク
- 生成AI導入に伴う偽情報生成のリスク
- モデルバイアスのリスク
AI向け独自データを保有における競合
- グレースノート (Gracenote):音楽・映像のメタデータ提供を行い、自動車やスマートテレビのレコメンド機能での競合として記載されているため
- エブリスタ (Evertyst):小説投稿プラットフォームの独自要素をデータ化しAI解析に活用する取り組みが競合/比較対象として挙げられているため
オルツ(260A)
AI向け独自データを保有における役割
個人の思考や特性をデジタル化する「P.A.I.(パーソナル人工知能)」により、AI向けの独自データを扱う
AI向け独自データを保有における強み
- P.A.I.(パーソナル人工知能)実現に向けた高度なパーソナライゼーション技術と、独自のデータ・技術基盤を有する
- 独自開発のLLM「LHTMシリーズ」を保有(2019年から日本語GPTの独自モデル)
- 小規模GPU環境でも動作する「LHTM-OPT」など、実用性に優れたモデルを開発
- 個人の発言スタイルや知識、個性を再現する「AIクローン」技術(デジタルクローンの制作が可能)
- 国内最大級の「AI議事録」サービスを提供
AI向け独自データを保有におけるリスク
- 売上の大規模な粉飾決算(「売上の最大9割が架空」等の指摘)が発覚し、上場廃止、民事再生法の適用、清算へ至ったこと
AI向け独自データを保有における競合
- Preferred Networks:国産LLM開発において、独自データ(製造・医療・ロボティクス分野のデータ)を保有して競合になると記載があるため
- E(LYZA):KDDIグループのデータ活用や日本語に特化した高精度なLLM開発で競合すると記載があるため
ユーソナー(213A)
AI向け独自データを保有における役割
企業データベース等の独自データを保有し、AI学習・活用(営業/マーケティング効率化)に提供
AI向け独自データを保有における強み
- 日本最大級の法人企業データベース「LBC」を基盤に、AI活用に不可欠な「高品質かつ膨大な独自データ」を保有している
- 1,250万拠点以上の法人データを保有し、事業所の網羅率はほぼ100%とされ、上場企業から個人事業主、海外法人までカバーしている
- 支店・工場・営業所といった拠点レベルまで体系化された独自コードにより、親会社・子会社等の系列構造を把握できる
- LBCを利用して超高精度な名寄せを可能にしている(自動化プロセス+人的チェックによるデータ収集・整備)
- 日本初のAI拡張型インテントデータ「興味サイン」を無償提供している(インテントデータ系の提供)
AI向け独自データを保有におけるリスク
- AI活用における機密情報・個人情報の漏洩リスク(生成AIに入力したデータが外部に出る可能性)
- データの情報源が、インターネット上の公開情報・商業登記簿データ等の購入データ、さらに同社社員や業務委託先が収集した企業の特徴に依存するため、収集・整備品質に起因する不確実性が生じ得る
AI向け独自データを保有における競合
- Sansan:企業情報(法人データ)を保有し、営業DX/企業情報活用の領域で比較対象になり得る
- SalesNow:企業データの検索・リスト作成やSFA/CRM連携によるデータ整備(名寄せ等)といった用途が、法人データ/AI活用文脈で競合候補として挙げられている
- Baseconnect:「Musubu」等のサービス文脈で、オンライン展示会プラットフォームを含む企業・データ活用の比較対象になり得る
- あかつき証券:インテントデータの集積(インテントマーケティング需要を睨んだ取組み)が、インテントデータ活用の文脈で比較対象になり得る
ユーザーローカル(3984)
AI向け独自データを保有における役割
SNSやWebサイトの行動ログ等の独自データを蓄積し、AIチャットボットやテキストマイニング等に提供
AI向け独自データを保有における強み
- 月間数十億PVにのぼる膨大な行動ログデータを自社で保有
- 国内最大級のSNSデータを自社で保有
- 保有データを解析して活用できる点
AI向け独自データを保有におけるリスク
- セキュリティ・ガバナンス:内部不正や設定ミスによる漏洩(例:社内ネットワーク内のアクセス権限設定誤り)
- モデルへのデータ汚染(Poisoning):独自学習データに誤情報や悪意のあるデータが混入すると、精度低下や偏った回答の可能性
AI向け独自データを保有における競合
- 株式会社ブレインパッド:User Insight(アクセス解析)やSocial Insight(SNS分析)といったビッグデータ/ Web解析領域で競合し得るとされ、独自DMPに強みを持つため
- 株式会社G(ENDA):ビッグデータやデータに基づく意思決定支援の領域で、ユーザーローカルのデータ活用(SaaS/支援ツール)と比較対象になりやすいため
メドレー(4480)
AI向け独自データを保有における役割
医療・ヘルスケア分野の専門領域データ等の独自データを保有し、AI活用につなげる
AI向け独自データを保有における強み
- 医療機関(B)と患者(C)をつなぐ「MEDLEY AI CLOUD」を通じて蓄積される膨大な独自データを保有
- 診察からカルテ作成、処方、通院管理まで一気通貫したデータをAI活用に最適化できる点が差別化要因
AI向け独自データを保有におけるリスク
- 情報の機密性に関するリスク(患者の疾患情報や処方内容など極めて機密性の高い個人情報を扱うことによる情報漏洩・プライバシー侵害)
- セキュリティ対策が不十分な場合のリスク(サイバー攻撃や内部不正による流出)
- AIの学習プロセスで機密データが適切に処理(匿名化など)されていない場合、AI出力結果から個人や機密情報が推察・露出されるリスク
AI向け独自データを保有における競合
- エムスリーデジカル:電子カルテ領域の比較記事の中で競合として言及されており、医療プラットフォーム/電子カルテの文脈で比較対象になりやすい
- ウィーメックス:電子カルテメーカーの紹介文脈で競合として挙げられているため、電子カルテの選定で比較対象になりやすい
- medimo:電子カルテメーカーの紹介文脈で競合として取り上げられているため、同じく電子カルテ領域で比較対象になりやすい
- アマゾン:「アマゾンも競合?」という文脈で言及されており、AI活用の観点で競合として意識される可能性がある
ダブルスタンダード(3925)
AI向け独自データを保有における役割
企業データや人物データなどの非構造化データを整理・統合し、AIの学習や分析に活用する独自データを保有
AI向け独自データを保有における強み
- AIが活用しやすい形にデータをクレンジング・生成する独自の技術力
- 独自アルゴリズムによる「データの高精度加工」(AIが即座に学習・活用できる高品質データへの自動クレンジング/整理・統合)
AI向け独自データを保有におけるリスク
- 技術的依存性(独自のデータクレンジング技術に依存するリスク)
- コンプライアンス(法規制)に関するリスク
- 市場構造の変化によるリスク
AI向け独自データを保有における競合
- Salesforce:名寄せやデータクレンジングに関する情報を提供しており、データ整備領域で比較対象になり得る
- NTT東日本:データクレンジングに関する解説を掲載しており、データ整備・活用の用途で代替比較され得る
- ゼンリンデータコム:住所正規化サービス等、名寄せの説明・提供に関連する内容があり、データクレンジング用途で比較され得る
- ナビタイムジャパン:住所クレンジング(住所リストの最新化・正規化)を提供しており、クレンジング領域で代替比較され得る
- MapFan:名寄せや住所正規化に関連する内容を提供しており、データ整備領域で比較対象になり得る
PKSHA Technology(3993)
AI向け独自データを保有における役割
コールセンターの音声データやチャット履歴などの対話データを大量に保有・活用し、AI向けに提供する
AI向け独自データを保有における強み
- 「アルゴリズムの社会実装」を通じて蓄積された膨大な独自データを保有
- 社会のプロセスにAIを組み込み、他社が容易にアクセスできない「質の高いデータ」を獲得・活用できる
AI向け独自データを保有におけるリスク
- 独自データに個人情報が含まれる場合、個人情報保護法への適合(取得経緯・利用目的等)が不十分だと行政処分や信用失墜につながるリスク
- 学習に使用するデータが他者の著作物等に該当する場合、著作権など知的財産権の侵害リスク(生成AIで出力結果が既存著作物に類似する可能性を含む)
AI向け独自データを保有における競合
- Preferred Networks (PFN):自社開発のAIエンジンや独自のLLMを保有し、独自データ・AI開発能力を活かす点でPKSHAと比較対象になりうる
- エクサウィザーズ (ExaWizards):自然言語処理・画像認識・予測モデル等に強みを持つとされ、AIデータ活用の文脈で競合・比較対象になりうる
Appier Group(4180)
AI向け独自データを保有における役割
消費者行動データなどの独自データを保有し、予測AIを用いたマーケティング自動化に活用する
AI向け独自データを保有における強み
- 「ファーストパーティデータ」を核とした独自データを保有
- 独自データを活用して高度なAI予測精度により収益(ROI)へ結びつける
- マーケティングの全工程(獲得・維持・収益化)をカバーするSaaSで、顧客企業の独自データをAIの学習に活用できる体制を構築
- 自律型AIの信頼性を高める研究成果(リスク認知能力を備えた意思決定フレームワーク)を公開
AI向け独自データを保有におけるリスク
- 規制環境の変化に伴う影響(例:Cookie規制。GoogleによるサードパーティCookie廃止など)により、独自データの収集手法へ直接影響を受ける可能性
- 各国のプライバシー法強化により、データ取得・利用における透明性が厳格化され、法的遵守コストが増大するリスク
- 独自データの品質(データ品質)の維持が課題となるリスク
- AIは学習データへの依存が大きく、データに偏りや欠落があると不公平な判断を下すリスク
AI向け独自データを保有における競合
- 株式会社PKSHA Technology:AI関連企業として比較対象になり得る旨の記載があるため競合・比較対象として挙げられる
ABEJA(5574)
AI向け独自データを保有における役割
製造・小売などの産業現場の実データに基づき、データ蓄積からAIモデル構築・運用まで提供する
AI向け独自データを保有における強み
- AIの「開発」だけでなく、企業の基幹業務(ミッションクリティカル業務)においてAIを「継続的に運用・改善」し続ける仕組みとノウハウを持つ
- 独自プラットフォーム「ABEJA Platform」を保有し、AIライフサイクル(データ収集・加工/アノテーション、AIモデル構築、業務への組み込み、再学習、運用監視)を一気通貫で管理できる
- 経済産業省が提唱する「デジタル版EMS」として、企業のDX/AI実装を一気通貫で支える独自のポジションを確立している
- ABEJA Platform上に、データのインプットやセキュリティ対応ができるツールや、汎用的なAIモデル等を備える
- Platform提供の実績として「300社以上」への提供が言及されている
- 流通・製造現場のカメラや各種センサー等で得られる膨大なデータをAIで解析し、マーケティングや業務改善・効率化につなげる文脈がある
AI向け独自データを保有におけるリスク
- 独自データに依存するため、データ品質や偏り・欠損があると、不公平な判断や精度の低い予測につながるリスクがある
- 古いデータを更新せずに使い続けることで、精度低下を招くリスクがある
- 独自の機密情報や内部情報をAIに学習させる場合、セキュリティ対策が不十分だと外部攻撃や内部不正によって重要情報が流出・公開されるリスクがある
- 高度なモデル(LLM等)では意思決定プロセスが複雑化し、なぜその結果に至ったかの説明責任(ブラックボックス化)の課題が生じる可能性がある
AI向け独自データを保有における競合
- PKSHA Technology:競合企業として挙げられ、独自のデータ基盤やドメイン知識を武器にビジネス実装を推進する点で比較対象になり得る
- Laboro.AI:競合企業として挙げられ、独自のデータ基盤やドメイン知識を武器にビジネス実装を推進する点で比較対象になり得る
- JDSC:競合企業として挙げられ、独自のデータ基盤やドメイン知識を武器にビジネス実装を推進する点で比較対象になり得る
- ExaWizards:競合企業として挙げられ、独自のデータ基盤やドメイン知識を武器にビジネス実装を推進する点で比較対象になり得る
FRONTEO(2181)
AI向け独自データを保有における役割
リーガル領域の膨大な訴訟・証拠データや医療・創薬分野の専門DBを保有し、AIで抽出・分析する
AI向け独自データを保有における強み
- 自然言語処理(NLP)に特化した独自AIを保有し、専門性が高く表に出にくい領域の解析に強い
- 法的紛争(リーガルテック)や創薬(ライフサイエンス)などの非公開・構造化データを活用できる
- 訴訟対応(eディスカバリ、フォレンジック)で培った独自データ(法的根拠、論文、特許情報など)と自社開発AI「KIBIT」を武器に事業展開している
- 特許取得の自然言語処理技術をいくつか持つとされている
AI向け独自データを保有におけるリスク
- 機密性の高いデータ(訴訟対応や医療分野)を扱うため、情報漏えいが発生した場合の損害賠償・法的責任・信頼性失墜リスクがある
AI向け独自データを保有における競合
- ブレインパッド:OpenWork上で「FRONTEOとブレインパッドの比較」が示されているため、AI分野で比較対象になり得る
- NEC:医療分野に強いAI開発会社の例として、FRONTEOと並列で挙げられているため競合になり得る
- NTTデータ:医療分野に強いAI開発会社の例として、FRONTEOと並列で挙げられているため競合になり得る
駅探(3646)
AI向け独自データを保有における役割
公共交通機関の経路検索データ等の独自データを保有し、AI学習・分析に活用可能
AI向け独自データを保有における強み
- AI向けの独自データとして、移動データ(動線データ)と、長年の経路検索サービスで蓄積された文脈(コンテキスト)情報の組み合わせを保有している
- 一般的なGPSデータでは把握が難しい「駅構内の立体的な移動」に関する独自データを保有している
- 東京駅や船橋駅など主要駅における乗車・乗換・降車データの詳細分析が可能
- 駅構内の混雑予測や最適な乗り換えルートの推奨にAI活用が可能
AI向け独自データを保有におけるリスク
- 保有する移動履歴などの独自データが外部に流出した場合、データ漏洩やサイバー攻撃により信頼失墜や法的責任に直結する可能性
- 移動データは個人の行動範囲を特定しうるため、匿名化が不十分な場合にプライバシー侵害のリスクがある
- 国際的な規制強化(例:EU AI Act)により、データの利用方法や透明性に厳しい制約が課される可能性
- 市場競争に関連するリスクがある
AI向け独自データを保有における競合
- ジョルダン:乗り換え案内サービスで蓄積した検索データに加え、MaaSとして自治体との連携データを保有し、AI活用(混雑予測等)でも競合しうるため
- ナビタイムジャパン:網羅的な移動データと技術力があり、AI・独自データの観点で駅探と同様の領域で競合しうるため
ケアネット(2150)
AI向け独自データを保有における役割
医療従事者の会員基盤と医療コンテンツデータ等の独自データを保有し、AI診断や医療向けLLMの学習データに活用
AI向け独自データを保有における強み
- 「医師の行動履歴」や「3万件超の独自医学ニュース」といった、同社だけが持つ一次データを保有している
- 医師会員(約20万人以上)のニュース閲覧履歴・アンケート回答・論文発表歴など、多面的な医師データを蓄積している
- 独自データを活用することで、汎用AIでは不可能な「医師一人ひとりに最適化された情報提供」を実現できる
AI向け独自データを保有におけるリスク
- 医師や医療従事者の行動ログ・アンケート結果など、機密性の高い独自データの漏えいリスク(設定誤りによる意図しない学習への利用)
- 医療・介護分野のデータ利活用は個人情報保護法など規制が厳しく、データ保護のガバナンス・セキュリティが求められる
- 医療情報の正確性(ハルシネーション)に関するリスク
AI向け独自データを保有における競合
- 調査結果には明確な記載がありません。
弁護士ドットコム(6027)
AI向け独自データを保有における役割
法律相談データや判例関連情報などの独自データを保有し、生成AI開発に直結する学習・分析に活用
AI向け独自データを保有における強み
- 20年にわたり蓄積された「日本最大級のリーガル(法的)データ」を独占的に保有している
- 独自の高品質なデータセットをAIに組み込むことで、汎用的AI(例:ChatGPT)の限界を補完している
- 法律相談サービスで、同社が独自に保有する相談データを組み合わせたAI回答が可能
- 法律AI基盤「Legal Brain」を開発し、法律データとAI技術を融合させている
AI向け独自データを保有におけるリスク
- 法律相談データや判例データには機密性の高い個人情報が含まれ、匿名化が不十分だと再識別リスクがある
- 法律相談目的で投稿されたデータをAI開発・収益化に転用すると、利用規約や個人情報保護法上の利用目的の特定・通知に抵触する恐れがある
- 独自データを学習したAIが誤った法的回答(ハルシネーション)を生成した場合、損害につながり、法的責任や信頼失墜につながる可能性がある
- 生成AI活用に伴い、機密情報や個人情報の漏洩リスクがある
AI向け独自データを保有における競合
- LegalOn Technologies:自社で蓄積した契約データや法律文献、判例などの「リーガルデータ」をAI学習に活用し、契約AIレビュー・管理領域で競争している
プラスアルファ・コンサルティング(4071)
AI向け独自データを保有における役割
顧客体験(CX)データやHRデータ等の大量の独自データを保有し、AI分析に活用
AI向け独自データを保有における強み
- 自社開発の高度なテキストマイニング技術
- 自社技術に基づく「膨大なドメイン特化型データ」を保有
- テキストマイニングツール「見える化エンジン」に、生成AI対話型分析「AIインサイト」を搭載
- 「タレントパレット」に、生成AIを活用した職務経歴自動生成機能を搭載
AI向け独自データを保有におけるリスク
- 「タレントパレット」等で、従業員のスキル・評価・適性検査結果などの極めて機密性の高い個人情報(独自データ)を扱う
- サイバー攻撃や内部不正による情報漏洩が起きた場合、顧客企業からの信頼喪失や損害賠償につながる可能性
- AI学習にデータを利用する際、匿名化が不十分、または利用規約を超えた範囲での利用とみなされると、コンプライアンス上の問題に発展する懸念
- SaaS事業(タレントパレット等)における市場競争の観点でのリスク
AI向け独自データを保有における競合
- 株式会社カオナビ:タレントマネジメント領域(人事データ活用)での競合。直感的なUIと顔写真ベースの人材管理に強みがあり、PACは「分析・予測」を重視するのに対しカオナビは「情報の集約・共有」の利便性で先行するため競合になりやすい。
- 株式会社HRBrain:評価管理や目標管理の効率化に強みがあり、近年はタレントマネジメント全般へ機能拡張しているため、PACと競合するケースが増えている。
株式会社JDSC(4418)
AI向け独自データを保有における役割
産業・インフラ領域の現場実数値データを収集・解析し、AIエージェント等に活用
AI向け独自データを保有における強み
- 「産業共通の課題」を解決するために複数の企業からデータを集約し、独自性の高いデータ基盤を構築・活用する「コンソーシアム(産業協調)」モデル
- 大手電力会社との協業により「スマートメーターの電力データ」を活用した独自データ基盤
- 独自データを用いた社会課題解決型AI(例:高齢者の「フレイル(虚弱状態)」検知)
- 独自データを用いた物流最適化ソリューション(不在配送を解消する用途)
- 個社ごとの最適化にとどまらず、産業横断型でのデータ蓄積と横展開
AI向け独自データを保有におけるリスク
- 顧客の機密情報および顧客が保有する個人情報を含むデータを取扱う場合があり、人為的なミスや不正ア...に関するリスクがあること
- ベンチャーキャピタル等の株式売却リスク
AI向け独自データを保有における競合
- 調査結果には明確な記載がありません。
ENECHANGE株式会社(4169)
AI向け独自データを保有における役割
電力比較プラットフォームを通じて蓄積された電力利用・料金データを保有し、AI診断等に活用
AI向け独自データを保有における強み
- スマートメーターから得られる「電力ビッグデータ」を活用(30分単位の消費電力データを解析)
- 独自開発の「AI・アルゴリズム」により電力使用実績から行動変容(節電余地など)を解析
- 独自保有する電力消費ビッグデータをもとに、料金シミュレーションのアルゴリズムを構築
- 電力会社やEV充電サービス事業者向けDXサービス(エネチェンジクラウドシリーズ)をSaaS型で展開
AI向け独自データを保有におけるリスク
- 制度変更および市場環境への依存(エネルギーデータの利用ルールや電気事業法などの改正で取得・商用利用が制限される可能性)
- 市場のボラティリティ(電力価格の変動により予測精度が低下したり、提携先である電力会社の経営悪化を通じて事業に影響する可能性)
- データの品質とセキュリティ
- 会計上の不確実性
AI向け独自データを保有における競合
- 調査結果には明確な記載がありません。
データセクション株式会社(3905)
AI向け独自データを保有における役割
SNSのビッグデータ等を起点にデータ分析・データサイエンスを行い、AIデータ活用に展開
AI向け独自データを保有における強み
- 創業以来蓄積してきた「膨大な独自データ」と、それを高精度に解析する「AI技術」を組み合わせた一気通貫のソリューション提供能力
- ソーシャルメディアデータを創業初期から長期にわたって蓄積しており、トレンド分析や消費者心理の把握で質・量の優位性を持つ
- テキストだけでなく、店舗内カメラ映像データやIoT機器のセンシングデータ等の「マルチモーダル」な独自データを保有
- AIインフラ(GPU・データセンター)事業の側面を持ち、GPUクラスターとしてNVIDIA B300 GPU(10,000個)搭載サーバー(1,250台)の調達に成功
AI向け独自データを保有におけるリスク
- 相次ぐ業績下方修正:2026年3月期通期の純利益予想を20億4800万円から4700万円へ大幅に下方修正
- 赤字の継続:2026年3月期第3四半期累計で4.6億円の経常赤字(前年同期より赤字幅拡大)
- 資金調達に伴うリスク:第三者割当増資や新株予約権の発行による資金調達を繰り返し、1株あたりの価値が希薄化するリスク
- 積極的な設備投資に伴う財務負担
- AI市場の激しい競争と人材確保
AI向け独自データを保有における競合
- Appier Group株式会社:Geeklyの「AI企業ランキング日本」内で売上高上位として言及されているAI企業
- ギリア株式会社:AIを活用した企業向けソリューション提供企業として、AI企業紹介記事内で言及されている
- ブレインパッド(3655):データ/AI活用分野に関する支援を行う企業として、競合候補として挙がっている
AI inside(4488)
AI向け独自データを保有における役割
AI-OCR「DX Suite」で蓄積された非定型文書データやAI学習用画像データを保有
AI向け独自データを保有における強み
- 主力製品「DX Suite」を通じて蓄積された膨大な「実務データ」を保有
- 自社開発の「マルチモーダルAI」技術力
- 累計60億回以上の利用実績(5万人以上のユーザーによる利用)により、実務利用データを学習に活用
- 大量かつ多様な帳票データを学習し続けることで高精度を維持(データ化精度99.999%の記載あり)
AI向け独自データを保有におけるリスク
- 第三者のコンテンツを学習に使用した場合、生成物が既存著作物と酷似し著作権侵害を指摘されるリスク
- 顧客データからAIを学習させる際、個人情報保護法等の法令遵守に加え、本人(消費者)からの理解が得られず社会的批判を招く可能性
- 契約更新に関するリスク(パートナーNTT西日本から契約の一部を更新しないとの報道に言及)
AI向け独自データを保有における競合
- Cogent Labs(コージェントラボ):AI-OCR領域で手書き文字認識(Tegaki)によりAI insideの対抗馬として挙げられている
- Cinnamon AI:AI-OCR領域の競合として、製品(Flax Scanner*)が言及されている
エクサウィザーズ(4259)
AI向け独自データを保有における役割
独自開発の「exaBase」で国内約400万社の企業情報ビッグデータを処理・保有
AI向け独自データを保有における強み
- 多様な産業分野の専門知見に基づく、独自性の高いマルチモーダルデータの活用
- MDV(メディカル・データ・ビジョン)との提携により、国内最大規模の医療ビッグデータを活用したAI開発を推進
- 動画解析技術を用い、ピラティスやヨガの動きなどの非構造化データ(マルチモーダルデータ)を扱う強み
- 単なるAI開発にとどまらず現場の課題解決に深く入り込み、他社が容易にアクセスできない質の高いデータを活用したソリューションを展開
AI向け独自データを保有におけるリスク
- 情報セキュリティ/プライバシー保護が重要リスク(医療・介護や金融など機密性の高い領域でデータを扱うため、データ流出時の経営影響が大きい可能性)
- 特定の顧客企業への依存度がリスク(特定顧客の投資行動等の変化の影響を受ける可能性)
AI向け独自データを保有における競合
- PKSHA Technology:AIプラットフォーム/AIプロダクト事業を展開し、業界データや業務知見の蓄積による差別化が競合になり得るため
- Preferred Networks:AI関連の事業者として、AI向けデータ活用・高度なAI提供で比較対象になりやすいとされているため
- A(BEJA):AIベンチャーとして、AIプラットフォーム提供やデータ・知見の蓄積による差別化で競合になり得るため
ブレインパッド(3655)
AI向け独自データを保有における役割
DX支援を通じて消費者行動データや需要予測に関わるデータを解析・蓄積
AI向け独自データを保有における強み
- 2004年の創業以来のデータ活用実績(データ活用のパイオニア)
- 国内最大級のデータサイエンティスト集団を擁している
- 1,400社以上のデータ活用支援実績(豊富な経験とノウハウ)
- 200名超のデータサイエンティスト在籍
AI向け独自データを保有におけるリスク
- AI向け独自データの活用に伴う情報の機密性保持(情報漏洩)リスク:顧客の機密情報や個人情報がAI入力・送信・保存を通じて漏れる懸念
- 個人データの取り扱いリスク:外部LLMの学習にデータが利用される設定の場合に漏洩リスクが高まる懸念
- 法規制の遵守リスク:本人同意など、個人情報保護法等の法的措置を担保し続ける必要
- データ品質管理リスク:生成AIのハルシネーションや有害な出力、外部データ汚染、意図しない挙動の発生リスク
- 外部環境の変化によるリスク
AI向け独自データを保有における競合
- Laboro.AI:ブレインパッドと同様に、データサイエンティストを活用しオーダーメイド型のAI開発(戦略コンサルから実装まで)で競合しやすい
- エクサウィザーズ:自然言語処理技術に強みを持つAI企業として、AI受託開発・コンサルティング領域で比較対象になりやすい
- プリファードネットワークス:先端技術(ディープラーニング等)を掲げるAI開発企業として、AI関連サービスで競合対象になり得る
- Retail AI:需要予測などの領域で比較対象として挙げられており、データ分析・AI開発の競合になりやすい
- データX:業界特化型のデータ分析会社としてブレインパッドと並列表記され、データ分析・AI開発で競合しやすい
- 三菱総研DCS:データ分析に強い会社として挙げられており、データ分析の外注先として比較対象になりやすい
- Rist:データ分析に強い会社として挙げられており、データ分析の外注先として比較対象になりやすい
Laboro.AI(5586)
AI向け独自データを保有における役割
顧客企業の戦略に合わせた「カスタムAI」を開発し、AI活用に用いる独自データ/学習用データの保有・活用に関与
AI向け独自データを保有における強み
- 顧客企業の独自データ(ドメイン知識を含む秘匿性の高いデータ)を最大限に活用して、ビジネス価値に直結させる「カスタムAI」の提供能力
- ビジネス×テクノロジーの融合(ソリューションデザイン)により、外資系コンサルティング出身者とエンジニアが連携して経営課題をAIで解ける形に翻訳できる
AI向け独自データを保有におけるリスク
- AI運用過程における情報セキュリティ・プライバシーのリスク(サイバー攻撃やデータ漏洩など)
- 独自データをAI向けに活用する際、ノイズやバイアス、誤ったデータ/改ざんされたデータによる汚染リスクがある
- 機密データを扱うため、セキュリティ体制への要求が高い
AI向け独自データを保有における競合
- PKSHA Technology(3993):カスタムAI(受託開発)やAIコンサルティング分野での競合として挙げられており、自然言語処理・画像認識などの領域で重なりがあるため
- ブレインパッド:カスタムAI(受託開発)やAIコンサルティング分野の競合企業として挙げられているため
SREホールディングス(6255)
AI向け独自データを保有における役割
不動産取引データ等の独自データを保有し、AIによる価格査定エンジンを提供・外販
AI向け独自データを保有における強み
- 不動産実務(売買仲介など)で得られる「実業に基づく固有・非公開データ」を保有し、それを直接AI開発に活用できるサイクルを持つ
- 独自開発のAI不動産価格推定エンジンとAPI連携により、マーケットバリューに基づいた物件査定を可能にする
- 不動産仲介で得られる現場の一次データ(成約データや顧客の生の声)を保有している点
AI向け独自データを保有におけるリスク
- データの陳腐化・競争激化
- 法規制・倫理的制約
- 情報漏えい・セキュリティ
AI向け独自データを保有における競合
- 株式会社GA technologies:AI不動産投資のRENOSYを展開しており、不動産×AI領域で競合になり得るため
ヘッドウォータース(4011)
AI向け独自データを保有における役割
企業の現場データを活用したカスタムAI開発(生成AIコパイロット等)を支援
AI向け独自データを保有における強み
- 企業の「眠っているデータ」をAIが使える形に変える力
- 暗黙知をAI活用のための構造化データへ変換する技術(SyncLect Data Intelligence)
- 現場で動く実用的なシステムに落とし込む実装力
AI向け独自データを保有におけるリスク
- 生成AI活用で、機密情報や個人情報の漏洩リスクがある
- 生成AI導入には、データ漏えい/プライバシー、偽情報生成、モデルバイアスといったリスクがある
- AI活用の情報漏えいリスクに加え、社内制度の整備や責任の所在が不明確になるリスクがある
- 欧州(EU)のAI規制法のような規制対応が必要になり得る(「許容できないリスク」には禁止の可能性)
- AI×ビッグデータ活用では、人材確保が課題になり得る
AI向け独自データを保有における競合
- Appier Group:AI企業ランキングで言及されており、AI領域の需要獲得で比較対象になりやすい
- アイデミー(5577):社内データを活用したAIエージェント関連の支援開始が言及されており、AI向けデータ活用の文脈で比較対象になりやすい
メタリアル(6182)
AI向け独自データを保有における役割
専門用語・翻訳データ等の独自データを蓄積し、法務・医薬向け生成AI開発に強み
AI向け独自データを保有における強み
- 2,000以上の専門分野にわたる膨大な「高品質な独自データ(対訳コーパス)」を保有
- 保有データを活用して、特定の業界・企業に特化した高精度のAIモデルを構築できる
- AI自動翻訳エンジンの開発において、膨大なデータセットを活用している
- 6,000社以上の顧客の機密データを安全に取り扱ってきた実績
AI向け独自データを保有におけるリスク
- 既存事業(自動翻訳)の減収リスク(生成AIを活用した「垂直統合型AIエージェント」への転換を進めている旨)
- 組織面のリスク(高成長時代にあった明確な事業戦略と組織能力の強みが、委譲後に消滅していた旨)
AI向け独自データを保有における競合
- 調査結果には明確な記載がありません。
WACUL(4173)
AI向け独自データを保有における役割
Webサイト改善提案AIを運営し、アクセス解析・成果データ等を保有
AI向け独自データを保有における強み
- 「39,000以上のサイトから収集した膨大なアクセス解析データ」を保有
- 「12,000件を超える施策の成功・失敗事例データ」を保有
- 独自の「勝ちパターン」をデータとして構造化し、AIが「何をすれば成果が出るか」の具体的改善提案を可能にする
AI向け独自データを保有におけるリスク
- プラットフォーム(例:Google)への依存が高くなる可能性
- 独自データの品質維持が課題になり得る
- セキュリティ・法規制(個人情報/機密情報の漏えい等を含む)に関するリスク
AI向け独自データを保有における競合
- Knowns:独自性を生む「ノウンズのリサーチデータ」が言及されており、独自データを活用して価値提供する点で比較対象になり得るため
インテージホールディングス(4326)
AI向け独自データを保有における役割
AI向けに利用可能な独自のPOSデータやパネル調査データを保有し、市場分析をAIで行うサービスに活用
AI向け独自データを保有における強み
- 国内最大級の「独自パネル調査データ」を保有している
- 保有データをAIが学習可能な形で最適化・蓄積している
- 国内最大級のパネル調査データ群を生成AIにインプットして活用できる
- 生成AIを用いたマーケティング戦略仮説の導出など、分析からの戦略仮説提案にデータを活用している
AI向け独自データを保有におけるリスク
- 情報漏洩・プライバシーのリスク
AI向け独自データを保有における競合
- マクロミル:ネットリサーチ・消費者データ系で競合し、AIの学習用データとして需要が高い大規模な消費者パネルを持つ企業として言及されているため
カカクコム(2371)
AI向け独自データを保有における役割
価格.comや食べログ等で収集されるユーザーレビュー・嗜好などの独自データを保有
AI向け独自データを保有における強み
- 「価格.com」や「食べログ」を通じて、月間数千万人のユーザーが投稿する膨大な一次情報(口コミ、評価、スペック比較データ)を保有している
- 商品スペック、価格推移、店舗情報(禁煙/喫煙、個室の有無など)まで細かくタグ付け・分類された高度に構造化されたデータ資産を保有している
AI向け独自データを保有におけるリスク
- AI開発企業による無断のデータ収集(スクレイピング)の対象になりやすく、データ資産が外部で安価に利用される懸念がある
- 保有データが個人の嗜好や文脈を含むため、AI学習・活用にあたってデータの取り扱いに関するリスクが顕在化しうる
AI向け独自データを保有における競合
- 楽天グループ:楽天会員IDに紐づく購買履歴データやポイント経済圏の行動ログなど、AI学習に活用可能な購買・小売領域のデータを保有しているため
- ヤフー(LINEヤフー):Yahoo!ショッピングの購買データに加え、検索・ニュース・地図など多様なライフログデータを横断的に保有しているため
- メルカリ:二次流通市場の価格・属性データに加え、取引時のチャットデータなどを保有しており、AI活用の比較対象になりやすいため
リクルートホールディングス(6098)
AI向け独自データを保有における役割
求人・不動産・飲食等に関する独自データを保有
AI向け独自データを保有における強み
- 求人・住宅・美容・旅行といった幅広いライフイベント領域で蓄積された、他社が模倣困難な「実数値(リアルデータ)」を保有
- AI活用指針を策定・公開
- データを元にユーザーが関心を持ちそうなアイテムを提示する「レコメンド」API等のDeep Learning/機械学習API群を社内で育成
- 「AI-Ready」データの整備に注力
- 非構造を扱いやすくする取り組み
AI向け独自データを保有におけるリスク
- データの転用に伴う法的・倫理的ハードル(目的外利用に伴う個別の同意やクリアランスの必要性)
- 外販事業での不透明性(Indeed等が保有する強力なデータを外部の一般事業に直接転用・外販できるかが不透明とされている)
- HR領域特有の公平性・ガバナンスの維持
- データセキュリティ/プライバシーを守る体制に関するリスク
AI向け独自データを保有における競合
- Indeed:HR(人材)テクノロジー領域で、データ量やマッチングアルゴリズムで競合し得るとされている
- パーソルホールディングス:HRテクノロジー領域で競合し、傘下(パーソルキャリア等)が転職者データを保有しているとされている
信越化学工業(4063)
AI向け独自データを保有における役割
半導体素材の製造プロセスで得られる品質・プロセスデータ等の独自データを保有し、AI活用に供する
AI向け独自データを保有における強み
- 生成AIの進化に不可欠な高品質な素材供給能力(AIインフラ向け素材を提供)
- 独自の製造プロセスや顧客との密接な開発で得られる高度なデータ(知見)を保有
- 半導体の製造における膨大なプロセスデータを品質管理・品質改善に活用し、高い品質を実現
- シリコンウエハーで世界シェア1位(約42%)とされ、AI向け演算に必要な欠陥のない高品質ウエハが強み
AI向け独自データを保有におけるリスク
- 米中対立による地政学リスク(機微技術の輸出規制やサプライチェーンの分断が事業継続に直接影響し得る)
- カントリーリスク(設備投資や原材料調達において安定的な供給網を維持できるかが課題)
- 売上・生産の地域偏在(売上の約3割が米国、かつ8割強が米国で生産)に起因する外部環境変化の影響
AI向け独自データを保有における競合
- S(UMCO):半導体ウェハーの「2強」として言及される競合(信越と比較対象)
- 富士フイルム株式会社:フォトレジストメーカーの主要企業として挙げられており、半導体材料分野で比較対象になり得る
- 住友化学株式会社:フォトレジストメーカーの主要企業として挙げられており、半導体材料分野で比較対象になり得る
三菱電機(6511)
AI向け独自データを保有における役割
工場の自動化やインフラ設備由来の稼働・センサーデータ等の独自データを保有し、AI活用に供する
AI向け独自データを保有における強み
- 製造現場・社会インフラ等で得られる「膨大なフィジカル(実世界)データ」を保有している
- 製造現場や社会インフラの「暗黙知」や「機器の稼働データ」など、IT企業がアクセスしにくいデータを自社で保有している
- 現場に特化した「フィジカルAI」(独自データ活用)へ注力している
AI向け独自データを保有におけるリスク
- 現場データをクラウドやデジタル基盤(Serendie)に集約する過程で、機密情報の流出・サイバーセキュリティリスクが高まる
- AIの誤動作リスクがあり、「完全に排除することはできなかった」
AI向け独自データを保有における競合
- NEC:インフラを長年支えてきた同業として、現場データ・デジタル領域で競合対象になりやすい
- 富士通:インフラを長年支えてきた競合同士として、現場データ・デジタル領域で競合対象になりやすい
- 日立製作所:フィジカルAIで現場の効率化を進める文脈で競合として言及されている
- ソフトバンクグループ:フィジカルAIの文脈で競合/対抗軸として言及されている
キーエンス(6861)
AI向け独自データを保有における役割
製造現場でのセンサー導入実績に基づく生産性改善データ等の独自データを保有し、AI活用に供する
AI向け独自データを保有における強み
- 製造現場から直接収集される「一次データ」を保有(センサー/測定器や画像処理システム等の導入で現場状況を数値化・画像化)
- 営業活動の行動データも含む「他社が模倣できない独自のデータ資産」を保有
- 現場ニーズに直結した学習データ(不良品判定、読み取り困難など)をAI搭載製品の開発に活用できる
AI向け独自データを保有におけるリスク
- AI活用に伴う機密情報・個人情報の漏洩リスク
- AI規制(例:EU AI規制法)の適用による制約リスク
- 製造業の設備投資サイクルへの依存度が高い場合、需要変動の影響を受けやすい
AI向け独自データを保有における競合
- ファナック:産業用ロボットの競合として挙げられており、大規模な自社工場を持つ「垂直統合モデル」が強みとされるため、製造現場の自動化・DX領域で比較対象になり得る
クボタ(6326)
AI向け独自データを保有における役割
スマート農業システムを通じた農機の稼働データや営農データ等の独自データを保有し、AI活用に供する
AI向け独自データを保有における強み
- 農機・建設機械・水インフラの現場から得られる、膨大かつ専門的なリアルワールド・データを独占的に保有
AI向け独自データを保有におけるリスク
- 機密情報・個人情報の漏えいリスク(AI学習や外部サービス入力時に、意図せず第三者に送信・保存されうる)
- 知的財産・優位性の喪失リスク(入力した独自データがAIモデルの学習に再利用され、他社にノウハウが提供されるおそれ)
- 不正確な分析・予測による影響(独自データ活用に伴う分析精度面の懸念)
AI向け独自データを保有における競合
- Deere & Company(ディア・アンド・カンパニー):トラクター等の農業機械分野での比較対象として言及されており、現場データを活用したAI競争の比較軸になり得る
- ヤンマー:スマート農業の文脈で「自動運転ロボットトラクター」への言及があり、農業の無人化・AI活用で競合になり得る
まとめ
本記事ではKabuMartの独自調査結果をまとめました。投資の参考にしてみてください。
また、KabuMartでは本記事のような調査を利用者の方も実施することができます。