たれぱんのびぼーろく

わたしの備忘録、生物学とプログラミングが多いかも

減点法・加点法の問題点

加点と減点が可能とする。
加点と減点を違うもののタプルとして扱う. 例: (-2, +5)
減点のみを評価した場合、最善戦略は減点されない行動をすること.
加点のみを評価した場合、最善戦略は減点されてもいいから加点行動をすること.

  • 最善の前者
    • それっぽくて結果を評価できないことをフワッと言い続ける
    • 何もしない (何もしないことが減点にならないならば)
    • 他者の減点ポイントを指摘し続ける
  • 最善の後者
    • 賄賂でも不正でもして評価指標を作り出す

後者の場合、枠外の理をとるために不正をしてもいいことにもなる (モラルハザード)

加点方式は他人の邪魔をしてもいいことが少ない.
他人の加点は増えないか増えるかで、自分の点は決して増えない.
大幅リードと時間制限があるときにしか機能しない.

減点: システムにあたえる負の影響を定量化したもの
加点: システムにあたえる正の影響を定量化したもの

目的: システムの総和を最大化する

減点を最小化する戦略で最善手を打つと総和0が想定される
減点は最小値の0、加点は意味がないので加点に使う労力を別に使うので0

加点を最大化する戦略で最善手を打つと総和はわからない
減点をいくらされてもいいので減点が膨大になって総和マイナスの可能性もある.

ステマティックに減点を防止、減弱させた上で完全加点評価を行えば総和が正で最適化する可能性がある

不具合が発生したら自動で補正する.
異常値の不具合が起きる場合は行動を停止させる.
補正 (が出来る程度の負の影響の補正) をbase負担として拠出させれば、負に行く可能性が多少ある行動をとるインセンティブができる (最悪でもbaseの保障が出るから).
完全加点なので大振りするように振る舞う.
でもシステムが異常値でる場合には行動をとめるので、ダウンサイドリスクが許容範囲内で正の部分の期待値が最大化される選択をする.
負の部分増やせば保障貰えるからそこに行きまくりそうなんもんだが、減点の打ち消しであり加点ではない. だから評価はされない.
加点(アップサイド)リスクがとても高い代わりに、許容範囲内で減点(ダウンサイド)リスクもかなりある、という選択肢をとるようになる.
完全加点だから異常値さえ行動止めておけば同じ行動はとるようになる.
ただ総和を最大化できるとは限らない.
減点の中でより減点が大きいものであっても別に選んじゃう (suboptimal)
それを回避したかったら減点も評価するか、そもそも減点を0に保障するか
わざと減点最大化するインセンティブがないので、保障しとくと減点は適当に振舞ってなんにせよ保障で0になる
保障コストは、分布形状になにか仮定を置かない限り、加点がより大きい選択肢で減点保障に必要なコストが多いとかは言えない.

完全加点方式の副次的ないいところ

なにかを叩かなくて(減点しなくて)よくなる.
加点する(褒める)だけしていればシステムの総合点があがることが保証されているので叩くことが不要.
批判は叩いてるの?→改善すなわち加点化を前提として問題点のあぶり出しとしておこなうならとてもいい。言いっぱなしなら無意味、不要
同意をとって(向こうから請われる形で)問題点を指摘するのがよさそう.

note.mu

prehyou2015.hatenablog.com