9月初自杀数字比6月激增?下结论前须注意分析细节

今日看到一个分析最近香港自杀数据的贴文[1](下文称为原文),结论是今年9月初的自杀数目比6月激增。

我使用了Benny Yeong的「2019年香港自杀资料数据库」[2]重做了一次分析,也同样做了10日平均线,但我的结论是7月初和3月初的自杀率比9月还要高得多。

原文得不到如此结论,我怀疑原因有二:

    10日平均线我使用的是移动窗口,并非将时间切开为一个个距离为10天的区间。这做法是一般Time Series分析(包括股市)的常用处理手法,比够能够消去数据的随机性。不肯定原文的数据来自何方。但我使用的数据库,有专人阅读报章剔除被重覆计算的案件。大家可以检视原数据的可靠性。

注意原文分析的时间仅由今年6月到9月,我认为只有一季的数据太短,数据的随机性会减弱结论可信性。但即使同样使用6月到9月的数据,我仍然得不到原文的结论。我认为7月初的自杀率显着比9月高。

当然,大家要注意我所用的数据也只有9个月,仍然不足以显示长期规律。由于自杀数据很受季节性影响,我认为只有用5年或以上的数据来进行比较,才有较大参考价值。

目前我做出来的这个图表,显示今年3月与7月的自杀数字比较高,也即是说,9月至今自杀数字没有太不符规律的增长。

请注意:统计分析是不可能告诉大家到底有没有「被自杀」个案的。基本上,除了实质证据(如太子站内闭路电视)能告诉我们事实真相,其他数字都只能作为一般参考。

注︰

    杀人警察(云吞博士的语言艺术Facebook专页帖文)2019年香港自杀资料统计

相关文章:

Fact-Check「云吞博士」的自杀数据关于香港6至9月自杀数据分析的争议,请先看原始数据警察从太子站赶走记者的后遗症

24小时求助热线/电邮

撒玛利亚会︰28960000 / jo@samaritans.org.hk撒玛利亚防止自杀会︰23892222 / touch@sbhk.org.hk生命热线︰23820000 / admin@sps.org.hk协青社︰ 90881023 / yoenquiry@yo.org.hk东华三院芷若园热线︰18281 / ceasecrisis@tungwahcsd.org

上一篇:
下一篇: