コメント数といいね数から質を数値化

「コメント数」と「いいね数」のバランスを見て、単なる割り算以上の「コメント欄の質の高さ」や「議論の盛り上がり度(有効度)」を正しく評価したい、ということですね。

ご指摘の通り、単純な割り算($\frac{\text{いいね数}}{\text{コメント数}}$)をしてしまうと、「コメント1件に対して10いいね(スコア10)」が、「コメント100件に対して500いいね(スコア5)」よりも高く評価されてしまうという欠点(分母が小さい方が有利になる現象)が起きます。

これを解決するための、目的別に使える3つの計算式を提案します。

パターン1:数が少ないときのブレ補正(ラプラススムージング)

最も実用的で、統計学やデータ分析でよく使われる手法です。分母に「下駄(定数)」を履かせることで、コメント数が極端に少ない投稿のスコアを抑えます。

$\text{有効度スコア} = \frac{\text{いいね数}}{\text{コメント数} + K}$

  • $K$(補正値)の意味: 「だいたいこれくらいのコメント数が平均値」という数値を入れます(例:1020)。

📊 この式でのシミュレーション($K=10$ の場合)

  • Aさん: コメント 1 / いいね 10 ➔ $\frac{10}{1 + 10} =$ 0.9
  • Bさん: コメント 100 / いいね 500 ➔ $\frac{500}{100 + 10} =$ 4.54

単純な割り算ではAさんの勝ちでしたが、この式なら「たくさんコメントがあって、しっかりいいねも付いているBさん」を正当に高く評価できます。

パターン2:コメント数(量)と いいね率(質)の両方を評価する(対数スケーリング)

「コメントの多さ(議論の活発さ)」も評価したいけれど、コメント数が100倍になったからといってスコアも100倍にしたくない(緩やかに評価したい)場合、対数($\log$)を使います。

$$\text{有効度スコア} = \log_{10}(\text{コメント数} + 1) \times \left( \frac{\text{いいね数}}{\text{コメント数}} \right)$$

  • 仕組み: 左側の $\log_{10}(\text{コメント数} + 1)$ が、コメント数に応じて「1倍、2倍、3倍…」と緩やかなボーナスを与えてくれます(コメント10件で約1倍、100件で約2倍、1000件で約3倍)。

📊 この式でのシミュレーション

  • Aさん: コメント 1($\log$部分: 0.3)× いいね率 103.0
  • Bさん: コメント 100($\log$部分: 2.0)× いいね率 510.0

「コメント数が多い」という実績がボーナスとして加算され、有効度として納得感のある数値になります。

パターン3:どちらかがゼロならゼロにする(幾何平均ベース)

「コメントだけが多くていいねがゼロ」あるいは「いいねだけが多くてコメントがゼロ」という極端な偏りを排除し、両方のバランスが良いものを高く評価します。

$$\text{有効度スコア} = \sqrt{\text{コメント数} \times \text{いいね数}}$$

  • 仕組み: コメント数といいね数を掛け合わせてルート(平方根)に入れます。総エンゲージメントの「勢い」を測るのに適しています。

どの式を選ぶべき?

Excelなどで一度計算させてみて、ご自身の感覚に一番しっくりくるものを選ぶのがおすすめです。

  • 「コメントが1、2件しかないのに、いいねが大量についている投稿」を最上位にしたくないパターン1(定数 $K$ は調整してください)
  • コメント欄の盛り上がり(議論の量)も、いいねの多さ(共感)も、両方欲張って評価したいパターン2

コメント

タイトルとURLをコピーしました