起订:1
发货:3天内
数据水印针对企业员工的泄露溯源
数据作为企业的重要资产,每天有大量数据在频繁交互,包括商业数据、财务报表用户和个人信息,它们以数据库(关系表)、Excel和CSV等形式存储和传输和处理。文件的频繁交互增加了数据泄露的风险,比如员工将的数据文件上传至互联网(比如公开网盘、论坛)、数据售卖给第三方,离职员工恶意数据等。
数据水印如何追责数据泄露
数据泄露后的溯源是一项重要的任务,一方面有利于了解安全管理与措施的薄弱环节,另一方面可起到心理威慑作用,追究责任,类似事件再次发生。针对企业员工的泄露溯源场景,任何员工数据到本地时,会触发水印嵌入器将水印信息(如员工ID、时间戳等)自动地嵌入到数据库(关系表)中。当数据发生泄露时,企业可提取水印信息,通过匹配与关联分析,溯源取证泄露者的标识ID,以及时间等信息。
数据库水印算法一方面需要更好地将水印标识信息隐藏到数据库中,另一方面需要满足嵌入后的透明性——仅允许一定范围内失真,因此它本质上可看成一个带约束条件的优化问题。从信号角度来看,数据库水印嵌入过程可看成一个大信号叠加了一个小信号,经过有噪信道后,如何检测到小信号——小信号的编解问题。根据水印嵌入过程是否需要改变原始数据库的元组的属性值和格式,嵌入方法主要可分为两大类:
1) 基于元组修改的水印嵌入算法:实质上,任何水印信息可编码转换成一连串由“0”和“1”组成的比特字符串。针对元组的数值属性(如年龄、时间戳)和类别属性(如地址信息等)两种类别,嵌入方法可再分为两种子类别:0”或“1”两种水印比特。为了保留数据可用性,修改应满足一定的约束条件(如统计特性)。简单的方式,是在数值属性值的很低有效位(Least Significant Bit, LSB)进行替换,比如在年龄18(二进制“10010”)很小LSB位嵌入“0”变为18( “10010”),嵌入“1”变为19(二进制“10011”)。其他可以在小数点后进行嵌入,或者使用不同的量化索引等嵌入机制。类别属性的嵌入方法:类别属性不能直接修改数值编码,一种思路是嵌入数据库用户不易察觉的字符或标点,比如通过在类别属性值末尾嵌入回车符、换行符表示“0”“1”,以及嵌入不同的空格数量等,常见嵌入规则如表1所示;另一种思路是基于语义的近义词进行嵌入,首先构建关键词的近义词库并确立顺序,嵌入过程根据约定规则嵌入“0”或“1”比特。
数据水印公司数据困扰
数据仅有在持续的商品流通、应用、共享和互换下才可以为公司创造财富,进而产生数据资产,也正是如此,数据在全部商品流通过程中的安全隐患也愈发的被高度重视起來。因为公司在运转的过程中必须多类型的系统软件及其很多的数据做支撑点,许多情况下融合工作要求或具体情景要求必须将含有敏感度、性数据的文档或数据开展共享、互换、储存等实际操作,在这个过程中则会有数据潜意识泄漏的状况产生。另一方面,因为数据资产可以产生极其丰富的权益使用价值,在利益熏心的迫使下,内部员工会有使用价值的数据资产开展进而给自己获得丰富的经济利润。