数据脱敏:随机生成手机号码;根据“姓”、“名”列表随机生成姓名

文摘   教育   2024-09-15 23:10   江苏  

点【关于本公众号】了解一下,欢迎关注谢谢!

快速浏览

实用案例

|日期控件||简单的收发存||收费管理系(Access改进版)|

|电子发票管理助手||电子发票登记系统(Access版)|

|文件合并||表格拆分||审计凭证抽查底稿|

|中医诊所收费系统(Excel版)||中医诊所收费系统(Access版)||银行对账单自动勾对|

|印章使用登记系统|

收费使用项目

|财务管理系统||工资薪金和年终奖个税筹划||新税法下工资表模版|

内容提要

  • 数据脱敏
  • 随机生成手机号码、姓名
大家好,我是冷水泡茶,这两天有点闹心,昨天刚有人要求我删除文章:

我这是惹上事了吗?有人要求我删文章!

今天又有一位发私信给我,要求删除文章,他也没有具体指明是哪篇文章,但我猜可能是9月8日的那一篇:

学校宿舍安排情况统计:根据学生宿舍安排表数据,生成学生宿舍分布情况统计表

此人讲话一点不客气,遇到一个暴脾气的可能得立即怼回去。
Anyway,不管他态度如何,我还是应该要积极处理的,但是删除是不可能删除的,把涉及学生信息的图片替换掉就可以了。
遇到这些事,感觉有点麻烦,不得不认真考虑“数据脱敏”的问题。
所谓“数据脱敏”,就是把敏感信息去掉,或者替换成模拟数据,比如公司名称、姓名、电话号码、身份证号码、银行账户等。
具体做法,在我们的VBA案例中,可以分为两种情况:

1、非数据处理的关键信息,这些数据不用来匹配、比较计算,我们可以用“打码”的方式处理,比如把中间一段字符替换成“*”号;

2、是数据处理的关键信息,比如要作为字典的Key,要进行比较计算等。如果数据量少,我们可以直接用“查找替换”的方式;但如果数据量比较多,那就有点麻烦了,一方面要考虑如何快速生成模拟数据,另一方面要考虑如何快速把原数据替换掉。

我们就拿9月8日文章为例,来看看我是如何进行数据脱敏的:

1、专业系、班别:这两列算不上敏感信息,但还是处理了一下。这里我采用了“对照表”+Vlookup匹配,复制粘贴的方式。

1)先在学生名单表中利用高级筛选取得不重复的专业系、班别记录,贴到另一张对照表里(专业);

(2)做好对照表,把旧记录与新记录一一对应,这里新旧记录是一样的,我把A列、C列旧记录都贴成新记录了(防止又形成敏感信息),大家知道什么意思就行了;

(3)在学生名单表里,在右边的空白列用Vlookup查询“专业”表中对应的名称,然后再复制粘贴到原位置;

(4)这里班别挺多,有57个,我就让ChatGPT帮我对照了一下,速度非常快。

2、姓名,这个有点麻烦,共有2599个姓名,可以采用以下方法:

(1)顺序号法:采用姓+顺序号,如张0001、张0002,在工作表中拖拽输入,比较省事,但不好看;

(2)错位组合法:把所有姓名贴到另一张表里,把姓名的每一个字符都提取到右边各列(比如讲B、C、D列),然后把某一列的字符稍微调整一下位置,比如,把C列第一行移到最后一行,C列整体向上移一行,再把D列前两行移到最后,D列整体向上移2行,最后把B、C、D列每一行重新组合成新的姓名,然后再贴回原位;

(3)随机生成法:根据给定的姓、名,随机生成不重复姓名,且与原姓名不重复,这是我们今天着重分享的方法:

A、在工作表“姓名”里,A列是不重复的姓,B列是不重复的名;
B、随机抽取一个姓、一个或两个名,组成姓名,确保这个姓名不包含在原来的姓名列表中,也不包含在已生成的新的姓名列表中;
C、我们设计了一个自定义函数generateNames,参数有gType,决定姓名是2个字、3个字或者是两者兼有; num,姓名个数;exDic,装有原姓名的字典;
D、我们把学生名单表装入数组arr,把学生姓名装入字典dic,然后调用函数generateNames生成姓名列表写入数组arrName;
E、把数组arrName写回学生名单表姓名列。

3、手机号码,可以随机生成11位不重复的数字,为了看上去比较像一点,我们生成数字的规则如下:

(1)首位是1;

(2)第二位是3、5、7、8、9当中的一个;

(3)后9位随便:

(4)我们也写了一个自定义函数generateNums,生成随机手机号码后写入原来位置。

示例代码详见第二条推文。

后记

1、我们把数据公开发到网上,除了法律法规规定必须是真实数据以外,应尽量使用模拟数据,保护隐私

2、如果不慎把真实数据发了出来,需要别人配合删除或者替换的,最好讲话能客气一点,这样比较容易达成你的目的。

好,今天就到这里,我们下期再会!


~~~~~~End~~~~~~

安利小店
安利的牙膏非常不错,用了以后就不想再用其他的了;洗洁精洗衣液也是日常必备,用过都说好!

合谷医疗
合谷医疗专攻各种疑难杂症,尤其擅长抑郁症焦虑失眠儿童神经发育异常多动症自闭孤独症腰颈椎疾病治疗,可谓神乎其技!体验过的直呼早点来就好了

喜欢就点个、点在看留言评论、分享一下呗!感谢支持!

案例文件分享说明

  • 案例文件可免费分享,但需符合以下要求:

  • 关注点赞点在看点...留言,方便的话分享一下就完美啦!如果不便走上面的“流程”,请打赏,万分感谢!

  • 请添加上方我的合谷医疗企业微信,案例文件通过微信发送。如有定制需求,亦可通过微信联系。

  • Excel问题,请在文章下面留言讨论!或者加入我的付费交流群提问

VBA编程实战
Excel应用案例、Excel VBA、公式函数使用技巧分享,思路解读...... 这里有鲜活案例、实用的技巧......
 最新文章