网站开发技术

手册365网站的代码开发技术介绍。

中文处理

手册365是一套独立开发的为注册用户或会员提供下载服务的网站。中文处理主要在于中文分词、汉语拼音和中文显示。

中文分词

中文分词最核心应用在搜索领域。

  • 常见的情形就是按用户的意愿切分用户输入的搜索关键词,准确呈现用户需要的搜索结果。
  • 实例:奥迪q5汽车说明书系统自动切分成:奥迪、Q5、汽车和说明书四个词进行搜索。

汉语拼音

汉语拼音主要用在拼音分类和排序上。

  • 常见的情形就是按字符串第一个汉字的拼音进行分类或排序。
  • 按汉语拼音进行分类和排序最核心的是首先获取汉字的拼音字母。
  • 根据字符串首汉字的拼音字母进行排序。
  • 实例:品牌列表页面按品牌名称第一个汉字的拼音进行了分类并排序。

权重搜索的核心就是搜索结果的排序,换句话说,就是搜索结果要以什么关键因子排序。

  • 核心权重因子:文档适用的型号、品牌和文档的类型。
  • 权重值:对权重核心因子在排序中的重要性赋值。
  • 排序:根据搜索结果的权重值进行排序,权重值最高的就是搜索最相关和最匹配的。
  • 实例:佳能5d手册系统自动切分成:佳能、5D和手册三个词进行搜索。
  • 搜索结果:包含佳能、5D和手册三个词的搜索结果最匹配,排在最前面,其中关键词用红色明示。

微信服务公众号

微信服务公众号