了解 Tag:从信息检索到寻找同好的利器

2024-08-24 20:04:34发布    浏览118次    信息编号:83921

友情提醒:凡是以各种理由向你收取费用,均有骗子嫌疑,请提高警惕,不要轻易支付。

了解 Tag:从信息检索到寻找同好的利器

Tag又叫(通俗分类)

标签的兴起源于两项社交网络服务的应用——del.icio.us书签和照片分享服务。这两项网络服务巧妙地运用了标签功能,并凭借其独特的易用性,在一定程度上引发了标签和小众分类的流行。

标签在信息检索和寻找志同道合的人方面具有重要价值,标签搜索的流行证明了标签在搜索领域可以很大程度上补充专业搜索引擎,是一个重要的研究方向。

当要寻找有相似兴趣的人时,标签可以让您轻松找到与您有相同兴趣的人,以便您找到志同道合的朋友。

目前,中国知名的博客托管服务商均已引入Tags并获得了相当的好评,中国领先的SNS网络也在积极开发和准备引入。

国内领先的专业分类信息社区Bigo分类搜索网认识到Tag在信息检索中巨大的价值潜力,在国内同类网站中率先推出Tag应用。

开发中首先面临的问题就是标签的关联,设计师rever提出的想法是

规则 1:文章 A 有三个标签 abe,文章 B 有三个标签 bcg,文章 C 有三个标签 ceb,文章 D 有三个标签 acb。那么标签“b”的标签是 3 次 c,2 次 e,2 次 a,1 次 g。如果只列出三个标签,则应该是:

癌胚抗原

规则 2:如果标签为“blog”,则列出所有包含“blog”的标签,例如“blog-”

在得到《人性化搜索引擎是搜索引擎的未来吗?》作者和《互联网洞察:标签与搜索》作者曾登高的建议后,Rever决定先采用规则1中的计算方式,并吸纳了王毅提出的多层标签等概念,并加入了加权的思想。

Bigo分类搜索网络目前采用的规则算法如下:

财经(结合传统分类目录)文章A有三个标签:abe

音乐B文章有三个标签:bcg

金融 C 类文章有三个标签:ceb

体育文章有三个标签:acb

假设不同类别的权重为0.5,同一类别的权重为1。

带有标签“b”的文章 A 的标签是

ax1+ex1+cx0.5+gx0.5+cx1+ex1+ax0.5+cx0.5 = 2c+2e+1.5a+0.5g

显示效果ceag

带有标签“b”的文章 B 的标签是

ax0.5+ex0.5+cx1+gx1+cx0.5+ex0.5+ax0.5+cx0.5=1a+1e+2c+1g

显示效果为caeg

目前,比购新版上线不久,效果已经明显体现出来。通过查看分类标签,我们可以看到网站上发布的热门标签信息较多,文章效果也初步体现出来。汽车报价、二手车交易即使没有标注“汽车”、“二手车”标签,在标签中仍然会显示与汽车类别相关的标签。用户在阅读时,可以直接点击“房屋出租”标签继续阅读,查找房屋出租信息。

最近在查看标签的时候,发现很多奇怪的词很显眼,仔细一看,原来是垃圾标签。这让我想起了 Keso 之前的问题:标签会因为垃圾信息而消亡吗?关于垃圾标签的问题,我思考了很多。防止垃圾标签的设计,必须限制每次发布的标签数量,严格监管相同信息的重复发布,一经发现立即删除重复信息,对恶意发布重复信息的用户进行删除甚至封禁 IP。

Rever认为,垃圾标签更多的是起到引导作用,而非限制作用;在利益驱动下,发布垃圾信息的人希望得到更好的结果。Bigou分类搜索网允许用户更新自己发布的信息,只需点击“更新”项,更新的信息就会在当前时间发布,并且信息会显示在最前面,效果与发布新信息相同。只要没有重复发布相同的信息,垃圾标签的危害就会大大降低,即使出现垃圾标签,也不会因为数量少而显得突兀。

虽然受到垃圾标签的威胁,但这并没有改变人们对标签未来的乐观看法。目前,人们非常重视标签技术,因为它代表了一种组织和管理在线信息的新方式。它不同于传统的针对文件本身的关键字搜索,而是一种模糊智能的分类。这更符合用户的流畅使用,提高了搜索结果的相似度。它将极大地促进用户查询数字文件的能力。照片、视频等多媒体数字文件都可以用标签进行管理。标签本身永远无法取代Yahoo之类的搜索引擎,但如果未来标签的应用逐渐增多,搜索引擎的使用量肯定会减少。

提醒:请联系我时一定说明是从奢侈品修复培训上看到的!