问答网站Quora改变了什么?

2010-11-12 09:31:54    商业价值   我要评论0   我要收藏   
打印
让机器懂得“当我们谈某某时我们在谈什么”正成为通向完美搜索道路上的一大障碍,也就是智能网络的关键问题之一。不过,现在Quora已经在这个问题的解决上取得了至少是值得世人重视的进步。

创始人、Facebook前高管

  你心中的完美搜索是什么样子?可能你的脑海中已经浮现出许多日常生活中困扰你的问题,它们应该不仅仅是想知道今天的天气和汇率如何那么简单。你也许更想知道,“未来3个月最热门的3部电影是什么,除了我已经知道的《让子弹飞》”;或者更复杂的,比如你想知道:老板让我组织这次上千人的公司年会,我该如何准备?”

  但是你在搜索引擎上根本找不到回答这种问题的满意答案,而在百度知道、雅虎问答这些网站上,并不能告诉你符合行业特点的知识。当然,也许费一番功夫,你可以在某个电影小组或者某个专业论坛里找到答案,但可能不是搜索引擎直接带你找到的。显然这不是你心目中的完美搜索。

  用户心目中的完美搜索应该像那本曾经流行的小说的名字一样,它能懂得“当我们谈某某时我们在谈什么”。比如当我们在谈李开复的时候,它首先要懂得我们在谈创业、天使投资、创新工场,也许还有《世界因你而不同》,甚至更多。再然后,才是现有搜索引擎能够做的靠关键词匹配和链接模式分析来帮你找到结果。

  实际上,上述的第一步——让机器懂得“当我们谈某某时我们在谈什么”正成为通向完美搜索──业内称之为“语义网”道路上的一大障碍,也就是智能网络的关键问题之一。不过,现在Quora已经在这个问题的解决上取得了至少是值得世人重视的进步。

  互联网的话题层

  Quora在硅谷风头正健。它由Facebook前CTO亚当·德安杰洛以及Facebook工程技术经理查理·切沃创建。2010年初开始内部测试的Quora在3月获得风险投资公司Benchmark Capital 1400万美元投资。据《华尔街日报》报道,估值为8750万美元。6月Quora开放注册,许多人开始使用并在极客圈中引起热议。

  Quora不像Twitter、Foursquare或者GroupOn已经具有一些盈利模式,似乎也因为这个原因,它并未在国内出现像团购热那样的众多跟风者。另一点原因是,如果完全模仿Quora,起步门槛其实并不低。Quora是一个功能比较复杂,对技术和运营能力要求相应也比较高的产品,即使模仿起来也有一定难度。还有一层原因可能是,除了网络达人和极客们的热议,尚没有更广泛的人群意识到Quora具备成为大型消费者网络的潜力和基础。

  许多人对Quora的第一个疑问可能就是如何保证如此多的人使用,还能没有垃圾信息,也就是保证问答的质量不随着使用人数的增加而变差。应该承认的是,这是一个难点,创始团队势必会在这方面付出很大的努力。但是,至少有一个关键点是可以在用户变多和问答质量好坏之间建立防御城墙的,即通过众包方式建立“话题层”。

  什么是话题层?我们都知道优质的答案其实来自于正确的提问。在很多时候我们往往没有标准答案,尤其是越来越多的用户在通过互联网找到意见性的答案,或者带有思考过程的软性答案,而非基本事实、真相求解的答案时。那么这些带有思考特征的结果,获取上的最大障碍就是我们一开篇提到的,要有一个谈话的语境,让机器理解这种语境,才能知道你想要什么,从而去做搜索和匹配。也就是说,我们找这种思考性问题的答案时,需要让机器的逻辑计算应用在一个话题内部,或者说限定在一个标签和标签的关系构成的“域”的范围内。

  举一个很简单的例子。当我们谈论“大夫”的时候,机器需要辨别我们是在说医院里的大夫,还是说中国古代的官员——如果上下文恰好有与治病、医院有关的信息,那就是前者;如果恰好有某位历史人物,那便是后者。当然,这仍然是概率问题。机器只是做简单的逻辑推理,但是某位历史人物为什么就和当作“古代官员”解释的“大夫”联系到一起,机器是无法搞懂的,必须由人告诉它。

  这时就需要“加标签”。Quora的机制里很重要的一点,就是用户给信息加上各种标签。这其实是用Web2.0的方式去建立知识之间的连接,而机器是可以去学习这种连接,从而改善查询结果的。知识总是在某些特定条件下才正确,通过赋予用户权力去为知识增加条件和联系,其实最终是可以做到去伪存真和去粗取精。亿万用户化身为一位“孔子”去整理好每一个问题,确保最优质的问题留下来等待合适的人去回答。

  就像古老的教育家孔子对弟子提问的每一次回答,也都是综合了“因时、因地、因材”等许多要素而产生的,只不过年代久远,人们忘记和忽视了那些条件或者当时的语境上下文。而现在的互联网新型社交问答,也必须有话题层的支撑,才有可能复制孔子的问答模式,让问与答站在同一个对话平台之上,而不是各说各话,还可以承载所有的话题和大量的使用者。

  运营话题层的机制

  过去的搜索是“爬虫”去抓取一个文本,可能是一个网页,然后分析关键词和链接,从而掌握这个文本和其他文本的关系,再依据逻辑推测出该文本的“话题”(Topic)。文本创建者如果注意SEO(Search Engine Optimization,搜索引擎优化),也会留有一些关键性的标签以提示搜索引擎文本的主题,但很难达到人性化的理解。整个过程概括起来,就是从文本到关键词,再到话题。

  谷歌中国研究院副院长张智威介绍说,“社交问答并不是传统搜索的顺序。它是用户提交给你话题,然后你去分析关键词和链接,最后排出一个最相关的文本,告诉你这就是你提交的话题内最合适的结果。”整个过程概括起来,是从话题到关键词,再到文本。

  实际上,Quora的一个创新点是用众包的方法或者说群体智慧,给所有话题都进行一次整理加工,从而提高机器学习的质量。在“话题层”下一番功夫并应用正确的处理方法,才是Quora改善问答质量的关键一环。接下来的重要问题就是我们上面提到的,运营这个网站的难度也不小,最核心的问题是如何给予专家以激励。因为问题的整理和优质答案的提供,实际依靠在人群中百分比不高的专家。那么,在既没有报酬,又没有名望的情况下,人们为什么要来参与这件事?也许维基百科的经验可以借鉴。

1 2

图文推荐

总裁汇O2O拟上市公司股权投融资平台

独家策划

更多
首届全国智能制造(中国制造2025)创新创业 在通往无人驾驶的神奇之路上,英特尔勇往直 蒙牛管理层巨变创始人牛根生辞职5年后重新
关于我们  |   法律声明  |   联系我们  |   网站导航  |   支付方式

工信部备案: 粤ICP备18005112号    公安部备案: 44030602004322

版权所有 总裁网 Copyright © 2007-2024 iChinaCEO.com, All Rights Reserved