Round A 2019 – Kick Start 2019

 

分治:为运算表达式设计优先级

241. 为运算表达式设计优先级

 

最长数对链

646. 最长数对链

 

信息抽取的几个challenges

  • 模型层面:
    • 一个字符一个标签的假定无法处理重叠或嵌套块(例如中国教育部部长,部长)
    • 以词为基本单位的设定难以应用到无自然边界的语言(如汉语),而以字为基本单位有歧义
  • 数据层面:
    • 有监督学习依赖于高成本的人工标注数据
  • 优化层面:
    • 与分类任务不同,信息抽取任务的类别分布有显著差异:正例样本远远少于负例样本;错误和歧义通常集中于某几个特定的类别对之间