实验室数据很有价值,有时极其敏感。特别是,如果他们在医学研究的背景下是个人的。数据保护至关重要:保护测试对象的隐私或公司机密需要量身定制的IT安全解决方案。
与其他生活领域一样,数字化早已进入实验室。计算机不仅支持常规的办公室工作,还使用“智能”实验室设备采集测量数据,协助进行统计分析,并计算模型或模拟。数据安全性在这里至关重要,因为多年来辛苦收集的测量数据的丢失可能会导致多年的科学研究或产品开发。由于IT或技术故障(如木马或病毒,勒索软件等)造成的数据丢失或无法识别的数据更改是严重威胁。
在这方面,实验室对IT安全的要求与其他领域对IT安全的要求没有太大差别。例如,一家贸易公司所有客户数据的丢失可能同样具有威胁性。因此,保护措施是相似的。另一方面,这一贡献旨在研究实验室特有的问题。本文重点介绍密码学研究,并介绍程序和解决方案,希望这些程序和解决方案能够很快达到足够的效率,以便在日常实践中使用,并提高实验室的IT安全性。
现代密码学不仅仅是加密
虽然,尽可能多趁乱如上所述,在日常生活中的IT安全(您应该备份,选择好密码,总是导入与安全相关的补丁),防护措施都没有现代密码学的最新研究课题。几十年来,当今IT安全产品中使用的基本密码机制已经得到很好的理解。近年来的所有攻击都不是对基础密码学的攻击,而是利用终端的差距或实施过程中的错误。在这里不应该考虑这些设备中的一些系统被弱化,故意插入错误。仅仅当前的事态对产品和客户都造成了不好的印象,他们似乎在IT安全方面接受了一切。然而,与此同时,目前的状态证明了密码学的力量,斯诺登的启示显示,密码学只能被绕过,但从不破碎。
现在的密码学已经超越了加密和数字签名。此外,密码学已经从工艺演变为科学。即使对这两种原始物质进行科学调查,也必须从数学角度定义“安全”或具体保护目标,以便使数学证明能够获得安全声明。这个基本原理将密码学与启发式IT安全性区分开来。最初,密码学试图将保护目标和/或安全概念正式化,以便基于定义明确的假设来开发解决方案,这些假设明确地满足模型中定义的安全概念。这种安全性证明适用于所有人,所以也是任何智能攻击者,因此也是以前未知的攻击。在本文中,现代密码学关于实验室特定问题的当前例子将被更详细地考虑。
示例隐私保护分析
密码学的当前研究领域是“隐私保护分析”(PPA)。全人口的长期研究可以为环境因素和个人遗传倾向对健康的共同影响提供有价值的见解。但是,这些研究收集的数据非常敏感。出于隐私的原因,个人主数据通常与其他数据严格分开。此外,例如,遗传和分子生物学数据再次在空间上与其余的临床数据分开存储,并用于记录不同的主键以分配给个体。为了使重新识别变得困难,只有少数人可以访问所有数据库。这显然使数据分析和新统计模型的想法测试变得复杂。为解除这种分离而采取的法律行动,如保密条款,主要增加行政负担,并不保证有效的保护,但只允许随后对侵权行为进行法律起诉。
然而,例如在医学中,使用来自不同研究的数据是非常有用的,例如通过基于一项研究的数据开发模型,然后在另一项研究的数据上进行验证。如果所开发的假设相对简单,那么在不传递遗传或临床数据的情况下进行荟萃分析就足够了。但对于复杂的统计模型,访问原始原始数据至关重要。但是,由于与原始主体或一般法律要求达成数据保护协议,通常禁止这种数据汇集。
解决矛盾:PPA和多方计算
在这里,现代密码学可以提供解决方案。近年来,机器学习对临床数据的自动分析在医学研究中发展迅速。隐私保护分析(PPA)将机器学习技术与安全的多方计算相结合。安全多方计算是一个密码构建模块。它允许多个相互怀疑的各方一起评估一个功能,每个参与方对另一方的输入一无所知。由于密码学方法,后者可以保证为任何智能攻击者提供保证。因此可以在此环境中使用安全的多方计算来消除隐私问题,
安全多方计算的一般方法使得以安全的方式评估任何函数成为可能,这是一个很大的理论成果。不幸的是,这些通用技术的效率相对较低。这是一个问题,特别是对于大量的数据。对于有限类别的功能,已经开发了定制的,高效的密码协议。尽管如此,PPA仍处于起步阶段。然而重要的是,例如通过这篇文章的可能性变得更加清楚,以便这些技术可以进一步发展和使用。隐私保护分析和安全的多方计算解决了矛盾。隐私保持不变,但仍然很大,可以拯救生命的总体研究是可能的。
准确定义数据保护的保护目标
如果输入是个人数据,安全多方计算的结果或PPA的分析结果可能是敏感数据。因此,在不违反隐私的情况下,您可以发布或使用哪些学习结果并不是先验性的。为了澄清是否可以继续使用结果的问题,数据保护的保护目标必须以数学方式精确定义。
目前研究中最受欢迎的术语是“差别隐私”。这种安全的概念确保每个个体的个体数据对研究结果的影响不大。非正式地说,这个安全术语定义如下:您要求查看它是否提供隐私兼容结果的算法在完整的数据集上执行一次。然后记录被减少一个主题并且算法再次执行。不同的是,无论从样品采取什么主题,这两个版本的相应的输出是在一定范围内的值,只有一个预定的上限,则算法的概率满足所述“微分隐私”一词。
差异隐私优于其他隐私保护条款的一个重要优势是它是一种数学上可证明的财产。该术语的可追溯性和精确性甚至影响了法律研究,迄今为止数据保护只是通过参考个人来定义的,而不是数据的有效性。密码学,安全多方计算和差分隐私创造了看似不可能的事实:它们允许进行大规模研究而不违反主体的隐私或泄露公司机密。
实验与分析
展源
何发
2021-01-11
2020-05-27
2020-05-27
2023-03-13
2020-05-27
2020-05-27
2024-03-06
2020-05-27
2024-01-22
加载更多