地磁気のノイズとプロダクトのシグナル

大学院では、草津白根山の熱水系に関わる地磁気変化を扱っていました。「データは嘘をつかない」——半分だけ本当です。データは黙る。喋らせるのは人間で、そこに希望も恐怖も都合も混ざる。当時、夜遅くまでモニタの前にいた自分は、答えを待っていたのではなく、どの言い切りを採用するかの責任から逃げたくなかっただけだと、今なら言えます。コーヒーが冷めても線は動く。動きは中立じゃない。切り取り方がもう物語です。

本稿は、その感覚がいまの指標や実験設計にどう刺さるかを書きます。地学とビジネスで対象は違う。それでも観測・仮説・検証の癖は似ます。地磁気のグラフもKPIも、人間が意味を与えるまでただの線。線に名前をつけるのが、地味に一番しんどい仕事でした。

地磁気の現場で鍛えたのは「断定の仕方」

ノイズは敵ではなく、前提である

連続観測のデータには、現象由来の変化以外にも、機器差や外乱、短周期の揺らぎが混ざります。仕事では「きれいに整えてから報告する」より先に、何を信号として扱うかを言語化する習慣がつきました。きれいな曲線を描いた瞬間ほど、観測条件を疑う、という逆説も身につきます。

現象か、ただの踊り場か

同じ曲がり方でも、母数が足りなければ踊り場に見えるだけ、ということがあります。地学の訓練は、式を暗記することより、観測条件と解釈の境界を意識することに時間を使いました。学会で発表する前に何度もやり直したのは、計算の速さではなく、言い切りの言葉を選ぶ練習でした。

公的な連続観測が示す「長い目線」

国内では、気象庁の地磁気観測所などが長期の観測資料を公開しており、デジタルデータのダウンロードやデータビューアなどで確認できます。個別の火山研究とはスケールが違っても、「同じ場所で、同じ手順で、長く積み上げる」ことの重さを思い出すのに役立ちます。プロダクトでも、定義を変えずに長く追える指標が少数あると強い、と感じます。四半期ごとにKPIをすげ替える会社は、観測点を毎月移動しているようなもので、トレンドの比較が効かなくなります。

プロダクトのダッシュボードに降りると、ノイズは増える

ログは増えるほど、物語の候補が増える

イベントログが細かいほど、説明の自由度は上がります。自由度が上がるほど、都合のいい切り口が増えます。私はレビューで「このグラフは、どの観測条件で切っているか」を先に聞くようにしました。聞けないグラフは、意思決定の道具としては信用しません。

セグメントの切り方は政治になる

セグメントは分析の武器です。同時に、誰の手柄を守るかの設計でもあります。地磁気でもビジネスでも、フィルタの名前を付け替えると曲線は別物になります。名前を付け替えた事実をログに残すかどうかで、組織の学習速度は変わります。

実験設計：帰無仮説の冷たさを味方にする

「効いてない」を先に丁寧に書く

仮説検証では、効かなかったことを雑にすると、次の実験が汚れます。私はメディア時代から、効かなかった仮説の一行メモを残す癖を持ち込みました。恥ではなく、観測の資産です。

ピーハッキングの誘惑

指標が多いほど、どれかは動きます。動いたものだけをスライドに載せる瞬間が、いちばん危ない。私はスライドの隅に「試した回数」と「採用しなかった指標」を小さく書くルールを自分に課しました。見栄えは落ちます。信頼は増えます。「何度も試して偶然当たった」系の落とし穴は、実験の文献でも繰り返し注意されます。本文末の参考文献では、Towards Data Science の整理や Statsig の仮説検証ガイドが、複数指標と解釈の観点で手がかりになります。

サンプルサイズの前に、観測の単位

地学でもプロダクトでも、いま何を一イベントとして数えているかがずれると、議論はすれ違います。クリックなのか、セッションなのか、コンバージョンなのか。単位が曖昧なまま「有意だ」と言い切るほど、あとから壊れます。私はキックオフで単位をホワイトボードに書き、その週は書き換えないルールを試しました。書き換えが必要なら、別実験として扱う。

ステークホルダーと「線の説明責任」

きれいな上向きは、全員の希望を載せやすい

経営、マーケ、プロダクト、現場。同じグラフを見て、別の物語を作りやすい構造があります。私は会議の冒頭で、いまの線が誰の意思決定に効くのかを一文だけ宣言させました。宣言できないグラフは、飾りです。

アラートの閾値は、恐怖の設計

閾値は統計だけで決まりません。何を怖がっているかの設計です。閾値を下げると安心に見えて、ノイズが増えます。閾値を上げると静かに見えて、取りこぼしが増えます。どちらが正しいかではなく、どちらのコストを払うかを言語化するのがPdMの仕事だと思っています。

再現性は、ドキュメントより「手順の共有」

学会では、同じ図を再現できるかが問われます。プロダクトでも、同じダッシュボードを別の週に再計算したときに同じ答えが出るかが問われます。私は「SQLの置き場」「抽出期間」「除外ルール」を、リポジトリかドキュメントのどちらかに必ず固定しました。固定しない再現性は、個人の記憶に依存する信仰です。信仰は強いですが、組織の学習には弱いです。

ドリルダウンは探索か、辻褄合わせか

ドリルダウンは発見の道具です。同時に、都合のいい説明を後付けする道具にもなります。私はドリルダウンで止まったら、一度タブを閉じて別の切り口から入り直す儀式を入れました。同じ穴を深掘りしすぎると、ノイズを信号だと信じ込みます。

火山とKPIの比喩を、使いすぎない

比喩は橋。橋を目的地にしない

研究の話は、会議を豊かにします。豊かにしすぎると、現場の単位が消えます。比喩は一文まで。二文目は数字か、ユーザーの行動に戻す。私は地学の話をした週に、必ず翌週の意思決定を一行書き留めました。書けなかったら、比喩は娯楽になっています。

ダッシュボード会議の「三十秒ルール」

グラフを映した最初の三十秒で、何を見ればこの週の意思決定が終わるかを口述させる。口述できないなら、その図はまだ観測ではなく展示です。展示は悪くない。ただ、展示のまま合意したふりをすると、翌週に同じ議論が返ってきます。私は口頭の三十秒のあとで、次に触る指標は一つだけに絞るルールを試しました。欲張るほど、ノイズが増えます。

観測倫理は、研究室の門を出たあとも消えません。チームを増やすほど、誰がどの線を他人の評価に使うかの設計問題にぶつかります。地磁気の現場で恐れていたのと同じで、「きれいな結論」を急ぐ圧力は、採用の場にも転がり込む。だからダッシュボードの話の延長として、採用の一文まで視野に入れておくと、あとで噛み合います。

採用面接で「データが好きです」は、続きを聞く

好きは十分条件じゃない。嫌いなときにどう振る舞うかの方が観測の質に効きます。ノイズの多い現場ほど、指標は人を晒しやすい。晒す前に定義を揃える癖があるか。地学の現場で身についたのは、式よりそっちでした。

まとめ

線は中立じゃない。中立に見えた瞬間が、いちばん危ない。

ノイズの中にいる感覚は、卑下する材料じゃない。不確実性のなかで次を選ぶ筋力の訓練だった。ダッシュボードを増やす前に、信号の定義と実験の守りを揃える。自然も市場も、説明書は渡してくれない。説明書を書くのはこちら側——それだけを胸に抱えて会議室に入る日が続く。

来週やるなら、これだけでいい。メモに一行残せなかった週ほど、あとで同じ議論を繰り返すからだ。指標を一つ選び、「これがノイズだったら、誰がどう困る？」をチームで一文ずつ書く。書けた週だけ、ダッシュボードは意思決定の道具に近づきます。書けない週は、まだ観測の準備が足りない。足りないことを恥じないほうが、長く戦えます。

データは誰かを救うこともあれば、誰かを晒すこともあります。線を画面に映す前に、守るべき人が誰かを一言で言えるか——地学の現場でもPdMの現場でも、最後はそこが倫理の入口になります。定義が共有できた数字は、冷たいだけじゃなく、チームを落ち着かせる道具になる。派手な勝ち方より、翌週も同じ連中で戦える勝ち方。地学もPdMも、最後はそこに落ちる。

夜更かしの観測室で学んだのは、線の読み方より線を語る責任の持ち方でした。会議室も同じです。誰が「有意だ」と言うのか。誰が「まだ早い」と止めるのか。役割が曖昧なまま進むほど、ノイズは勝ちます。

観測ログを眺めていた頃、いちばん怖かったのは「何も起きなかった週」ではなく、起きたように見える週でした。PdMも同じです。上がった週ほど、定義を疑う。疑えないチームほど、あとで大きく裏切られる。裏切りは、データのせいにしやすい。人のせいにしやすい。どちらも半分だけ本当です。

仕上げのための自問（現場メモ）

いまのグラフは、観測条件が一言で言えるか

言えないなら、まだ解釈の準備が足りない。

効かなかった仮説のメモはあるか

無いなら、学習は個人の記憶に閉じている。

比喩を使ったなら、翌週の決定は何か

無いなら、比喩は娯楽。

ダッシュボードの数は、三枚以内か

増えるほど、物語は増えます。物語が増えるほど、責任は薄まります。

参考・出典

気象庁地磁気観測所, 観測資料・データ提供（データビューア等）, https://www.kakioka-jma.go.jp/obsdata/obsdata.html （参照: 2026-04-06）
LogRocket Blog, "Signal vs. noise: How to identify the metrics that truly matter", https://blog.logrocket.com/product-management/signal-vs-noise-metrics-that-matter/ （参照: 2026-04-06）
Statsig, "A comprehensive guide to hypothesis testing in product experimentation", https://www.statsig.com/perspectives/hypothesis-testing-guide-product-experimentation （参照: 2026-04-06）
Towards Data Science, "Why Most A/B Tests Are Lying to You", https://towardsdatascience.com/why-most-a-b-tests-are-lying-to-you/ （参照: 2026-04-06）

本記事は個人の経験に基づく比喩です。研究・市場の再現性を保証するものではありません。