无状态中的 "状态" 到底指的是什么?
|
案例详解 | 基于Embedding的特征安全计算 假设原始矩阵是 10,000 行 1,000 列,那么分解后即可得到如下三个子矩阵: U 矩阵为 10,000*10,000 Sigma 矩阵为 10,000*1,000(除了对角线的元素都是 0,对角线上的元素称为奇异值) V(^)T矩阵(V 的转置)为 1,000*1,000 实际应用过程中,我们只保留 U 矩阵的前 512 列,于是三个矩阵的维度就变成了:10,000*512,512*512,512*1,000。为什么是保留 512 列呢?原因是奇异值在矩阵Σ中是从大到小排列,而且奇异值的减小特别快,在很多情况下,前 10% 甚至 1% 的奇异值之和,就占了全部奇异值之和的 99% 以上了。根据我们的多次实验,512 列已经能够很好的保留奇异值的信息。 4,矩阵分解得到三个子矩阵后,将 U 和 Sigma 相乘,得到输出矩阵。输出矩阵的维度为 10,000*512。可以看到,输出矩阵与输入矩阵有着相同的行数,每一行仍旧代表一个设备。但是输出矩阵的列数变为了512,与原始矩阵中每一列是一个属性不同,此时的输出矩阵中每一列对应一个特征。该特征不具备可解释性和可识别性,这也就保证了输出数据不会泄露个人隐私。 5,将输出矩阵直接输出,TDS 平台的使用方可以通过数据接口进行调用。因为平台使用方无法获得 V 矩阵,故而无法还原得到原始矩阵,也就无法还原出任何与个人相关的原始属性信息。 输出时,需要将所有的数据先整理成步骤 2 中的标准输入格式,然后拼接成一个输入矩阵。之后的步骤与上述示例中相同。 效果 对于 Embedding 算法在数据安全输出的实际表现,TalkingData 做了很多相关实验,也在多个实际项目中进行了验证。以下用两个真实案例进行说明: 案例一:性别标签预测效果提升 性别标签是基于设备信息通过机器学习模型预测打分得出的。在过往的建模过程中,算法人员往往会对原始信息进行一定的处理,比如将非结构性的数据处理为结构性的统计数值,或者将其他标签作为特征输入到模型中。但是,这些特征工程方法都会产生一定的信息漏损或者误差引入。
而 Embedding 处理后的数据相比人工的特征筛选,由于信息漏损较少,理论上会取得更好的建模效果。从以下两图可以看出,基于相同原始数据,使用 Embedding 模型的预测效果比原始性别预测模型提升 (0.71 - 0.63)/0.63 = 13.7%。 NVIDIA?Jetson Nano?开发人员工具箱是使用最广泛且最受欢迎的工具,可提供计算性能,以前所未有的大小,功能和成本运行现代AI工作负载。开发人员,学习者和制造商现在可以为图像分类、对象检测、分段和语音处理等应用程序运行AI框架和模型。它还包括板支持包(BSP)、Linux OS、NVIDIACUDA?、cuDNN和TensorRT?软件库,用于深度学习,计算机视觉,GPU计算,多媒体处理等。该软件甚至可以使用易于刷新的SD卡映像来使用,从而使其快速,容易上手。 其他值得注意的包括NVIDIA Jetson TX1,TX2,TX2i(可承受更高的振动,温度和湿度范围以及灰尘),适用于RISC-V AI + IoT的Sipeed Maixduino套件、Raspberry Pi 4计算机模型B、Coral开发板等。 实际应用: 毫无疑问,边缘人工智能将改变我们的未来。公司和公司已经开始合并它,以向客户提供高效且无忧的体验。其中一些实例是:
边缘人工智能的用途和潜力因行业和公司而异。虽然基于边缘的推理已经被证明是云计算的一个更好的选择,但是在这一领域还有很多工作要做。 (编辑:揭阳站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
