人工智能系统开发:AI不会以数据集结束

人工智能系统开发:AI不会以数据集结束

我们现在的AI很多都是通过大量的数据统计分析得到的处理结果进行合理的智能处理方式。所以我们现在的人工智能其实也就是模仿我们处理的方式来处理数据的人工智能,并不是让他们模仿我们人类的思考方式,没法实现正正的创造有类似人类思维的AI,所以很多人认为AI会以数据集结束。大事也有很多人有不同的意见,那么我们能创造除此之外的AI吗?

机器学习(包括称为“ 深度学习 ” 的更着名的分支)当然是至关重要的。ML算法在许多AI领域都很常见,它们是非常深奥的关键,它可以帮助机器从一些模糊的输入中猜出所需的结果。将数据集加载到模型中即可 - 您可以获得预测。ML使这种情况发生。媒体得到消息。如果您现在阅读最受欢迎的文章,您可能只会相信AI会神奇地解决所有问题。总体配方对于故障是平庸的 - 收集数据集,找到可以插入问题复杂性的ML算法,训练模型并简单地收集数据。

然而,正如任何真正的AI实践者都知道的那样,ML虽然至关重要,但并不是问题的核心。谷歌ML研究人员的一篇开创性的NIPS论文深入解释说,机器学习只是人工智能应用的一个微不足道的部分。大部分工作围绕优化管道,收集干净数据和提取适合ML模型的特征,并且可在动态环境中维护。这在自然语言理解中尤为突出,为了提取适合分类器模型的特征,需要解决拼写错误,词干,停用词,消除实体引用的歧义,可能,查看上下文,了解人们经常使用化妆单词,准备好慢慢改变词汇和主题分布,以及无数其他的东西。

有人可能会问,为什么不完全跳过这个并将任务加载到一个强大的深度学习框中?当然,我们可以交换数据建模的复杂性,以便在培训阶段花费更多时间?好吧,祝你好运。你有没有尝试过预测树木年轮的天气?它们是相关的......你的机器应该能够找到从一个到另一个的路径。问题是,在发生这种情况的时候,你可能会在地下安静地休息。一些最强大的超级计算机用来预测更具影响力的信号的天气仍然会做出不准确的预测。有一个原因 - 计算的指数复杂性不是开玩笑。

这就是领域专业知识变得无价之宝的地方。简而言之,人类专家可以通过提供机器的快捷方式来修剪大量不必要的计算。南宁区块链开发公司发现这是通过使用多年来在特定领域中积累的知识人类专家建模推理路径来完成的。继续使用NLU,一个很好的例子是利用来自语言学的信息来丰富数据,例如词性,句子结构(即解析树),拼写法等。要了解这些好处,请考虑如何有效地管理复杂项目。你要做的第一件事是分解并建立中间里程碑。它们的范围更小,更容易定义,因此更容易到达。然后,实现更大的整体将减少到达每个中间里程碑,这更容易定义和跟踪。

但是建模比采取捷径还要多。培训数据集的支持者忽视了过多的领域,在这些领域中甚至很难定义如何编译数据集以进行培训。这意味着人们很难向注释器(用预期结果标记数据集的那个)解释如何为每个数据样本提出预期结果的逻辑。南宁软件开发公司了解到,有时,标签的含糊不清使事情复杂化。其他时候,分析输入数据的复杂性 - 向人类提供所需的感官数据可能是完全不可能的。在物理世界中,某些测量可能对注释器是危险的(例如,如果您的输入是气体)。这些情况中的每一种都立即使得从一开始就收集数据的整个过程变得不可行。

可能值得重新审视从AI“分支”的所有领域。其中一个共同的主题是令人难以置信的领域建模和知识。例如,机器人技术依赖于运动,力学,材料,电气工程,光学和其他更基础的科学的物理学。虽然最终结果可能是将图像输入CV单元,但大部分“魔法”实际上在此之前发生。换句话说,完全不是用于“魔法”AI应用的ML,而是用于描述系统正在进行预测的域的公理,定理,测量,调整等的混合。ML只是锦上添花。这些领域的应用程序不依赖于机器来将输入与输出相关联,而是将领域知识放在首位,自下而上地建立自己的技术 - 从基本规则到复杂系统,可能会与ML建立一些步骤。它们的整体构成总是由域逻辑驱动。

南宁鸿业软件了解到现在很多人工智能系统也是通过大量数据统计获得的规律来实现智能处理的,市面上的AI人工智能系统开发也大多处于这个阶段。


分享到:


相關文章: