无状态中的＂状态＂到底指的是什么？

发布时间：2021-02-20 16:26:41 所属栏目：评论来源：互联网

导读：案例详解 | 基于Embedding的特征安全计算假设原始矩阵是 10,000 行 1,000 列，那么分解后即可得到如下三个子矩阵： U 矩阵为 10,000*10,000 Sigma 矩阵为 10,000*1,000（除了对角线的元素都是 0，对角线上的元素称为奇异值） V（^）T矩阵（V 的转置）为 1,0

案例详解 | 基于Embedding的特征安全计算

假设原始矩阵是 10,000 行 1,000 列，那么分解后即可得到如下三个子矩阵：

U 矩阵为 10,000*10,000

Sigma 矩阵为 10,000*1,000（除了对角线的元素都是

0，对角线上的元素称为奇异值）

V（^）T矩阵（V 的转置）为 1,000*1,000

实际应用过程中，我们只保留 U 矩阵的前 512 列，于是三个矩阵的维度就变成了：10,000*512，512*512，512*1,000。为什么是保留 512 列呢？原因是奇异值在矩阵Σ中是从大到小排列，而且奇异值的减小特别快，在很多情况下，前 10% 甚至 1% 的奇异值之和，就占了全部奇异值之和的 99% 以上了。根据我们的多次实验，512 列已经能够很好的保留奇异值的信息。

4,矩阵分解得到三个子矩阵后，将 U 和 Sigma 相乘，得到输出矩阵。输出矩阵的维度为 10,000*512。可以看到，输出矩阵与输入矩阵有着相同的行数，每一行仍旧代表一个设备。但是输出矩阵的列数变为了512，与原始矩阵中每一列是一个属性不同，此时的输出矩阵中每一列对应一个特征。该特征不具备可解释性和可识别性，这也就保证了输出数据不会泄露个人隐私。

5,将输出矩阵直接输出，TDS 平台的使用方可以通过数据接口进行调用。因为平台使用方无法获得 V 矩阵，故而无法还原得到原始矩阵，也就无法还原出任何与个人相关的原始属性信息。

输出时，需要将所有的数据先整理成步骤 2 中的标准输入格式，然后拼接成一个输入矩阵。之后的步骤与上述示例中相同。

效果

对于 Embedding 算法在数据安全输出的实际表现，TalkingData 做了很多相关实验，也在多个实际项目中进行了验证。以下用两个真实案例进行说明：

案例一：性别标签预测效果提升

性别标签是基于设备信息通过机器学习模型预测打分得出的。在过往的建模过程中，算法人员往往会对原始信息进行一定的处理，比如将非结构性的数据处理为结构性的统计数值，或者将其他标签作为特征输入到模型中。但是，这些特征工程方法都会产生一定的信息漏损或者误差引入。

而 Embedding 处理后的数据相比人工的特征筛选，由于信息漏损较少，理论上会取得更好的建模效果。从以下两图可以看出，基于相同原始数据，使用 Embedding 模型的预测效果比原始性别预测模型提升 (0.71 - 0.63)/0.63 = 13.7%。

NVIDIA?Jetson Nano?开发人员工具箱是使用最广泛且最受欢迎的工具，可提供计算性能，以前所未有的大小，功能和成本运行现代AI工作负载。开发人员，学习者和制造商现在可以为图像分类、对象检测、分段和语音处理等应用程序运行AI框架和模型。它还包括板支持包(BSP)、Linux OS、NVIDIACUDA?、cuDNN和TensorRT?软件库，用于深度学习，计算机视觉，GPU计算，多媒体处理等。该软件甚至可以使用易于刷新的SD卡映像来使用，从而使其快速，容易上手。

其他值得注意的包括NVIDIA Jetson TX1，TX2，TX2i(可承受更高的振动，温度和湿度范围以及灰尘)，适用于RISC-V AI + IoT的Sipeed Maixduino套件、Raspberry Pi 4计算机模型B、Coral开发板等。

实际应用：

毫无疑问，边缘人工智能将改变我们的未来。公司和公司已经开始合并它，以向客户提供高效且无忧的体验。其中一些实例是：

万豪国际集团与三星和罗格朗(Legrand)合作，使用物联网和边缘AI创造了世界上第一个启用物联网的酒店客房。这些房间在多个位置具有高度个性化，可让客户根据应用程序中存储的信息完全按需设置房间。
日本汽车制造商丰田公司正在利用为汽车制造而设计的现有AI边缘机器人技术，以帮助行动不便的人。
自主交付系统，例如亚马逊的交付无人机和多米诺机器人，利用计算机视觉来导航障碍物并有效地优化路线。两家公司使用Edge AI来提供数据，地理位置，预测的时间范围和个性化更新。
相反，工厂中具有AI功能的边缘计算系统可以将多台计算机的数据关联起来，以检测并最终预测导致停机的问题。
Expensify的虚拟助手Concierge可协助公司自动进行费用报告和差旅安排。它可以通知客户实时价格变化，甚至可以代表他们提交收据。

边缘人工智能的用途和潜力因行业和公司而异。虽然基于边缘的推理已经被证明是云计算的一个更好的选择，但是在这一领域还有很多工作要做。

（编辑：揭阳站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

无状态中的 ＂状态＂ 到底指的是什么？

无状态中的＂状态＂到底指的是什么？