2019“达观杯”算法大赛,达观数据寻找世界信息抽取最强者

  • 时间:
  • 浏览:0

“达观杯”是由国内领先的文本自动化出理 企业达观数据主办的面向全球范围学生、学者和企业研发人员的算法大赛。旨在通过提供业务场景、真实数据、专家指导,进一步提升中文自然语言出理 技术的研究水平,为业界选拔和培养有志于自然语言出理 领域的算法研究和应用探索的青年才俊,探索更多因为、开启无限未来。

2019 “达观杯”是达观数据举办的第三届算法大赛。2017年和2018年,达观分别以“个性化推荐”和“文本分类”为主题主办过两次大赛,在全国范围内引起了很大的反响,两次比赛吸引了海内外近万支队伍参赛。

本次大赛自7月上线启动以来,已吸引来自海内外2六个国家和地区的2300余名选手参赛。本届“达观杯”的任务是信息抽取,给定一定数量的标注语料以及海量的未标注语料,在六个字段上做信息抽取任务。在信息抽取技术方面,达观数据拥有数十项国家发明人人专利,并在多家金融机构和政府单位实施落地。这项技术也被用于达观RPA,使其成为更懂中文的RPA。

赛事背景

信息抽取(Information Extraction),即从自然语言文本中,抽取出特定的事件或事实信息,帮助亲戚亲戚亲戚我们歌词 我们歌词 我们歌词 我们歌词 我们歌词 我们歌词 将海量内容自动分类、提取和重构。文本智能抽取是信息检索、智能问答、智能对话等人工智能应用的重要基础,它还还里能克服自然语言非形式化、不选泽性等现象,发掘并捕获其中涵盖的有价值信息,进而用于业务咨询、决策支持、精准营销等方面,对产业界有着重要的实用意义。

达观数据的文本信息抽取技术已应用于金融、制造、通信、法律、审计、媒体、政府等多种文字密集型行业,为企业自动化抽取文档的关键信息、对比不同版本的文档差异、纠正文档文字错误、以及发现文书中潜在的法律风险,以下分享六个实例。

本次大赛顾问团队包括复旦大学教授黄萱菁、上海交通大学教授常辉、复旦大学计算机教授肖仰华、中科院自动化研究所刘康、清华大学教授李涓子、北京大学教授万小军等人。

大赛设现金奖励共七万七千元,一、二等奖获得者将获得吴文俊人工智能科学技术奖的提名推荐因为,比赛排名前30的选手将获得达观数据全职工作和实习的面试直通因为。

第三届“达观杯”算法大赛将于8月31日截止,并将于9月在北京举办线下颁奖典礼,参赛选手、业界领袖,专家学者讲齐聚一堂,共襄盛举。

关于达观数据

达观数据成立于2015年,专注于利用先进的自然语言出理 、光学字符识别(OCR)、知识图谱等技术,为大型企业和政府机构提供机器人流程自动化(RPA)、文档智能审阅、垂直搜索、智能推荐、客户意见洞察等智能产品,让计算机代替人工完成业务流程自动化,大幅度提高企业下行速率 。先后斩获中国人工智能领域最高奖“吴文俊人工智能奖”、全球三十大最佳创业公司、中国人工智能创新企业30强等荣誉。2018年完成1.6亿元B轮融资,成为语义分析人工智能细分领域获得融资金额最多的企业。