火星科技网您的位置:首页 >家电科技 >

微软开源关键Bing搜索的搜索算法

导读 无论信不信,关键字查询构成了网络搜索的一小部分。得益于谷歌镜头和Bing视觉搜索等工具,计算机视觉算法的推动力超过了他们的公平份额,自

无论信不信,关键字查询构成了网络搜索的一小部分。得益于谷歌镜头和Bing视觉搜索等工具,计算机视觉算法的推动力超过了他们的公平份额,自然语言处理模型也支持像Alexa和Google智能助理这样的智能助手。不断增加的媒体组合是微软转向另一种AI技术 - 空间分区树和图(SPTAG) - 以更好地解析搜索的一个原因。它现在可以在开源中使用,还有示例技术和附带的视频。

正如微软在博客文章中解释的那样,SPTAG使开发人员能够利用结果查找AI来筛选矢量 - 单词,图像像素和其他数据点的数学表示 - 以毫秒为单位。微软表示,SPTAG(用C ++编写并用Python包装)是许多Bing搜索服务的核心,它已被用来帮助公司的研究人员“更好地理解”数十亿“网络搜索背后的意图” 。

要查看它的实际效果,请尝试点击Bing中的搜索查询“巴黎的塔楼有多高?”。它会产生正确答案 - 1,063英尺 - 即使问题中没有出现“Eiffel”这个词,结果中也不会出现“tall”这个词。

那怎么样呢?分配给数据位的向量可以彼此接近地排列或映射以指示相似性。这些近端结果会显示给用户;在Bing中,执行搜索后,扫描索引向量以提供最佳匹配。此外,分配用于训练模型,这些模型考虑搜索后最终用户点击等输入,以“更好地理解搜索的含义”。

微软表示,Bing Search迄今已对超过1500亿条数据进行了编目,包括单个单词,字符,网页代码段和完整查询。“Bing每天处理数十亿个文档,现在的想法是我们可以将这些条目表示为向量,并搜索这个1000亿以上向量的巨大索引,以便在5毫秒内找到最相关的结果,”Bing项目经理Jeffrey说道。朱。

Bing团队期望开源SPTAG可用于构建可识别基于音频片段所说语言的应用,或用于让用户拍摄鲜花照片并识别属和物种的服务。

“当人们提出问题或拍照并询问搜索引擎时,关键字搜索算法就会失败,'这是什么?'即使是几秒钟的搜索也可能使应用无法使用,“Bing集团项目经理Rangan Majumder说。“我们只是开始探索在这个深度上进行矢量搜索的真正可能性。”

标签:

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。