环保署限制科学的规定可能会危及你的机密研究数据

2020年3月5日上午10:00
TheHilaryClark / pixabay.com
188betcom网页版

这是烟草业在20世纪90年代提出的一个很好的故事要透明在美国,为影响烟草业的政策提供信息的科学研究应该是“合理的”。如果允许烟草公司重新分析这些研究中使用的基础数据,他们可以更好地确定这种“合理性”。众多内部文件已经表明,烟草业向政策制定者提出这一建议的主要原因是获得将吸烟与肺癌联系起来的研究的原始数据,目的是对这一发现背后的科学产生怀疑。它从来不是关于科学的“合理性”;这是一种拖延基于科学的规则制定的策略。以前,我的工作是分析并保护数千名研究参与者的私人健康信息,所以当我听到烟草公司想要从慷慨的人那里获取这些数据,用于盈利计划时,我感到毛骨悚然。

这是起源的故事环境保护署(EPA)提出的题为“加强监管科学的透明度”的误导性规则,该规则正如我们以前所指出的将削弱科学在环保署的作用,并危及我们的健康和安全。3月3日,环保局宣布他们将会这样做发行增刊对于这条规则,开放30天的评论期,这似乎是糟糕得多比原来的规则。

和烟草公司一样,美国环保署也是他谎称如果该机构将他们的注意力限制在“特定的”科学研究上,他们就可以利用这一规则来增加科学的透明度——科学家们已经放弃了他们的数据,并愿意将其提供给公众监督。如果该研究的作者不愿意交出他们的数据那么环保局在制定空气污染和化学品安全等健康保护规则时就不能参考这项研究。这可能会限制该机构在他们的决策过程中使用科学无休止的和有偏见的重新分析那些对科学产生怀疑的经济利益相关者的数据。其结果是,该机构将无法实施科学合理的措施,保护我们所有人免受环境危害。

但环保署的规定是在以另一种方式给我们所有人下毒。自EPA规则的新补充仅列出了三类数据(机密商业信息、专有数据和不能匿名的数据)可能的隐私保护,我们可以假设该机构认为a简单的匿名化过程足以充分和彻底地保护人们的机密数据。收集和分析人类数据的科学家,比如儿童铅中毒他们认为,环保署的规定与研究参与者的数据理应得到的安全和保护严重不符。值得仔细研究的是,为什么要更详细地研究这一点。

这项规定会危及人们的个人信息。

在加入UCS之前,有五年多的时间,我曾在两个不同的公共卫生实验室工作:一个是加州的实验室,收集土著居民和有色人种的酗酒和吸毒数据;另一个是英国的实验室,收集住在城镇贫困地区的人的医院医疗记录,这些人最近刚刚中风。为科学实验室贡献时间和个人信息的人通常是在做一种利他行为——他们为研究人员提供了有价值的科学知识,而这些知识并没有直接让他们受益。我很感激成千上万的人信任我和我的同事,把最私密的信息告诉了他们,因为人类健康研究完全依赖于这些善行。因此,像其他公共卫生科学家一样,我非常认真地对待我保护这些数据的承诺,因为我觉得我对这些慈善人士有义务和责任。

人们信任科学家的私人信息,因为法律和道德框架这是为了保护科学研究中的人类参与者;例如,《健康保险携带和责任法案》(HIPAA)要求医疗信息受到一套管理、物理和技术保障措施的保护。安全措施可以包括匿名化等流程。匿名化数据集是从数据集中提取高度敏感的信息,这些信息可以很容易地识别出人的姓名、地址和社会安全号码。但科学家在这一过程中进一步保护数据免受黑客等威胁的情况并不少见。科学家采取的措施可能包括在没有互联网连接的计算机上工作,对数据进行加密,对数据库进行密码保护,将医学/生物信息存储在上锁的房间里,甚至使用物理保险箱。

美国环保署似乎认为,匿名化的过程是保护人们数据所需要的全部。但匿名数据并不是数据保护的全部,许多人都可以从匿名数据库中识别出来。简单的工具,比如互联网搜索和一个数据库查询查询重新确认了研究参与者的身份。一篇论文发现,只需15个特征(如年龄、性别和婚姻状况),机器学习程序就可以重新识别99.98%来自匿名数据库的美国人的数据另一篇论文发现,一名研究参与者的居住地区可以从著名的环境研究中推断出来,准确率高达80%到98%。因此,一个简单的匿名化过程,就像EPA规则中的那样,不足以保护人们的个人信息免受公众的侵害。

这就是为什么科学家们觉得这条规则如此可怕

让我们想象一下这样一个场景:几位科学家想要让他们的工作告诉该机构的政策制定过程,决定遵循EPA的限制科学规则,交出他们的研究数据。后果会是什么?

根据他们研究的知情同意程序和机构审查委员会(IRB)批准的要求,向公众发布原始匿名数据的科学家可能违反了资料私隐条例.而且这些数据可能包括那些永远无法对这样的过程表示同意的参与者,比如已经去世的研究参与者。环保署的规定也可能会对未来的研究参与者造成阻碍。如果人们认为科学家会将他们的私人数据(以匿名形式)公布给全世界,人们可能就不太愿意报名参加研究了。

由于匿名化本身并不是一个完全安全的过程,在这种情况下,一些研究参与者的名字几乎不可避免地会被识别出来。这可能是极具破坏性的。想想看,如果以下主题的信息与一个人的就业、保险或个人关系有关联:虐待儿童、性侵犯、非法药物使用、精神疾病、移民身份、性取向、遗传信息或性传播疾病。在基因信息等情况下,这些数据可能会揭示研究参与者亲属的敏感信息,包括那些尚未出生的亲属。

你可以做点什么来阻止这一切

在一份罕见的联合声明中,六种著名的科学期刊对环保署的规定敲响了警钟,称“提案对‘透明度’的推动将被用作一种机制,在政策制定中压制相关科学证据的使用,包括公共卫生法规。”他们还表示,一些数据“不能公开分享;即使是匿名的个人数据也可能被重新识别,长期以来,机构和期刊都承认数据隐私调整的价值。”

环保署的限制科学规则将导致该机构在制定规则过程中无法考虑严格、全面和有影响力的研究。我们人民将为政策制定过程中科学投入的减少和我们的健康和安全付出代价。但你可以做一些事情来改变这一点。环保署规定的评论期即将开始我们强烈建议你写信给环保署,使用我们的公众意见指南告诉他们你对这样一条规则的真实看法,这条规则剥夺了科学为EPA的健康和环境政策提供信息的能力。