日前,专注人工智能认知领域的AI创业公司Rich AI睿企科技正式对外发布又一款全自主智能产品 —— 睿企大数据搜索引擎。据悉,其搜索速度可达业界通用开源方案Elastic Search的10倍之多,这也是继获得千万美元级别天使轮融资之后,睿企科技在行业内发布的又一重磅消息。
大数据新鲜不再,如何“炼化”成应用关键
1980年,美国学者Alvin Toffler在《第三次浪潮》中将大数据认为是“第三次浪潮的华彩乐章”,但直到2009年,大数据技术才在IT产业中崭露头角。现在大数据已不是一个新鲜词汇,但随着5G、物联网时代的到来,人工智能的迅速发展,数据增长进入了空前的发展阶段,企业拥有更多数据资产的同时,也对现有的大数据处理技术提出更高的需求。
目前无处不在的PC、物联网、智能终端等设备就像开着的水管,产生的数据源源不断。但因缺乏快速的数据处理技术,海量数据就成了一个很难挖掘的矿井。
Rich AI睿企科技认为:只有掌握了先进的炼化技术,才能真正发挥大数据矿井价值。而大数据搜索引擎与认知决策引擎就是大数据炼化器和人工智能发动机,是对海量企业大数据进行数据关联、关系汇聚、知识提炼和价值挖掘的通用型工具和入口。
时至今日,大数据搜索引擎已经成为企业大数据平台的标配。正如互联网搜索引擎打开了互联网价值之门的钥匙,大数据搜索引擎也已经成为了打开大数据价值之门的钥匙。
速度为王,如何满足大数据的1秒定律?
大数据的三个特征中,velocity(速度)最为关键,甚至有人提出了大数据的“1秒定律”,即庞大的数据量要在1秒内处理完毕,才会对业务产生应有的价值。
速度决定一切,这在时间要求严苛的公安等行业更为重要,甚至有可能关系到整体技战法的改变。怎么能够加快海量数据计算的速度?专家认为,应该针对不同类型的数据提供不同的处理算法,比如专门针对长文本数据、音视频等非结构化数据等设计专用检索、计算方法等,而这都是目前行业通用的搜索技术不能满足的。
据悉,目前市场上市搜索引擎普遍为国外来源引擎Elastic Search技术,缺乏安全保障,速度慢,资源要求高,也不支持非结构化数据搜索,更没有智能认知能力,不能充分发挥大数据的价值。尤其一个不可忽视的问题是,与计算机的操作系统市场一样,国内绝大多数的大数据平台,包括政府、公安、大型企业在内的核心部门,都是基于ES产品做上层应用。近一段时间以来,由于搜索引擎导致的大规模数据泄露问题时有发生。
研发中国自主可控的安全、高效、智能的数据搜索及认知引擎,促进我国大数据产业向纵深发展,已经成为一个越来越迫切的问题。
自主研发,RichAI睿企科技推出搜索引擎
Rich AI睿企科技牢记“要实现两个一百年奋斗目标,一些重大核心技术必须靠自己攻坚克难”的指示,集中优势科研力量,基于自然语言处理、知识图谱、计算机视觉、大数据等一系列关键技术突破,通过自主研发,设计新型架构,自主设计完成了高效、智能、安全、全球领先的大数据智能搜索与认知决策引擎。
Rich AI睿企科技自主研发的大数据搜索引擎相比国外同类产品有如下几个优势:
1.安全:
实现基于用户身份的搜索,内置多重安全验证机制,提升搜索安全,拒绝数据泄露:
内置基于用户名和密码认证的支持
支持第三方认证方案,如企业LDAP、Active Directory等
支持基于角色的访问权限控制
支持添加用户与角色,支持自定义用户到角色的映射关系,实现灵活的多级访问权限控制
支持索引和内容的解耦
支持详细的用户行为审计日志
2.可扩展:
全部组件皆可通过添加机器的方式,实现横向扩展
搜索引擎服务集群,可以无限水平扩展,可通过负载均衡提供统一的地址
在线数据存储,包括基于内存的KV存储和基于SSD的KV存储,都是可以横向扩展的分布式存储方案
索引数据发布服务,支持大数据分布式计算,可以通过添加计算节点提高索引生成速度。
3.异构数据支持:
不仅支持表格型结构化数据,还支持文本数据、视频数据、图像数据等非结构化数据的一站式搜索
4.高效:
支持数千张关联表格数据的快速搜索,文本搜索响应速度及并发性能均较Elastic Search提升10倍以上;视频图像搜索性能指标较同类产品提升数倍;单服务器可实现数亿图片以图搜图秒内响应、数十亿文档全文搜索秒内响应。
5.智能:
睿企科技通过自主研发的语义分析技术、视频结构化技术、知识图谱技术将非结构化的文本与视频图像智能炼化成可关联、融合、推理的知识图谱,形成基于知识的决策引擎,并在搜索中通过对用户意图理解、认知推荐与闭环反馈,不断迭代学习,自我成长。
聚行业伙伴合作之力,拓睿企科技产业生态
全球已进入以数据研究应用为导向的“大时代”,大数据正成为一种生产资料、稀有资产,全面融入社会生产生活。小到解决特定企业业务效率,大到政府实时洞察城市情况,大数据正深刻改变着世界的经济格局、利益格局、安全格局,全球正在同步上演一个大片:大数据的速度与激情。
过时的数据分析结论是没有价值的, 时间对数据平台来说永远是紧缺的。没有好的性能,数据的价值会被打很大的折扣,这要求数据平台要在数据查询、统计处理、结果展现上,都必须具备良好的性能。
此外,国家对数据安全和数据隐私管理的要求也日益提升,如欧盟已出台“GDPR”法案,对数据的保存和处理提出了新的要求。这就要求产业在进行大数据处理技术选型时须以“数据安全性”作为第一考虑,其他需求在该准则前必须让步,这就要求相关核心技术必须自主可控,睿企自主大数据搜索引擎的出现给我国大数据产业提供了一个低成本、高可靠、强安全的大数据搜索解决方案。
据悉,Rich AI睿企科技的大数据搜索引擎已经在多地公安、政府、石化、金融等行业中成功应用,取得良好效果。睿企科技也希望连同产业上下游合作伙伴,以搜索引擎与认知决策引擎为核心,合力于建设中国自主的大数据产业生态,让每一个企业和组织拥有自己的智能搜索引擎和AI大脑,赋能高质量发展。(一鸣)