必要な2つの透明性

 GW中は、自粛要請に従い、ステイホームを堅守しておりましたが、自粛疲れに加え、毎日、新型コロナウィルスの感染者数集計のアップデートがリリースされる度に聞こえてくる、なんともスッキリしない同じような、一喜一憂のトーンの解説にも疲れてしまった方も多いのではないでしょうか?さすがに、連休終盤くらいから、山中伸弥教授などの有識者から声が上がり[1]、ここ数日では正確なデータ評価へ向けた動きが出てきました。未曾有の事態ですから、意図しない不都合に対しては誰も非議されるべきでもないと思いますが、論争自体は、すでにブログでも別な話題[2]で重要性を指摘したデータ分析の”透明性”の問題が顕在化した事例です。

 特に、今回の場合には、大きく2つの透明性が問われていると思います。一つは、すでにメディアで取り上げられている、データの開示の透明性で、新規患者への検査数など、検査の過程上、明らかに存在すると思われる(あるいは、労力次第で集計できる)必要なデータは開示されず、主観的判断に合致するデータのみを重視するならば、その評価の信頼は大きく損なわれます。もう一つは、ロジックの透明性です。この場合、話題となっている陽性率の算出の事例のように、必要なデータをなくして、どう正しく評価したのか?といったプロセスの透明姓に加え、フレームワークの透明性(具体的には、適用したモデルと選択理由になると思います)が、別途、問われると考えれます。分析する専門家は、それぞれのアプローチで、適切な仮定の元でモデル分析します。それ自体はまったく問題ないのですが、一つの結果を基準として採択する場合には、そのモデル仮定と選択理由については、透明にする必要があるかと思います。

 実際、COVID-19の分析モデルの透明性への要請は、専門家の間でも高まっているようです。CoMSES Netという世界の社会及び環境科学のシミュレーションモデルに従事する研究者、教育者や実務家によるコミュニティでは、COVID-19の分析モデルのコードの公開や情報シェアの要請を呼び掛けております[3](私のところにも、SD societyを通じてレターがきました)。やはり、今回のパンデミックに対抗するには、世界の英知を結集して、信頼性の高いモデルを共有することが重要であるとの意識の高まりかと思います。日本においても、出口戦略の基準が設定され、新たな行動規準を設定するには、最適なモデル分析が重要で、今後は、専門家間に留まらず、一般の関心は、前述の”第1の透明性”から第2の”モデルの透明性”へ移ってゆくものと考えられます。

 また、これも時折、話題にしてきましたが、やはり、データ分析に基づく戦略を有効に実践するには、データ分析の専門家のみではうまく機能しないということも、垣間見えたようにも思えます。やはり、データリテラシーの高い意思決定者を中心に、基幹分析結果を自身の専門分野に焼き直すことができる、複数の横断型のデータ分析人材が重要です。現在においては、一日も早い事態の収束を願うばかりですが、Post-coronaの時代に、本格化すると予想されるデータ駆動型社会やデジタルビジネスの推進に際しては、収束後は一度振り返り、学ぶべきことは多いと思います。

 

<参考サイト>

[1] 山中伸弥による新型コロナウイルス情報発信

http://www.covid19-yamanaka.com/cont3/16.html

[2] IT調査会社の”市場評価値”にも今後は透明性が求められる?(2018年6月05日付ブログ記事)

[3] Call for transparency of COVID-19 models

https://science.sciencemag.org/content/368/6490/482.2

2020年05月08日