网站开发技术
手册365网站的代码开发技术介绍。
中文处理
手册365是一套独立开发的为注册用户或会员提供下载服务的网站。中文处理主要在于中文分词、汉语拼音和中文显示。
中文分词
中文分词最核心应用在搜索领域。
- 常见的情形就是按用户的意愿切分用户输入的搜索关键词,准确呈现用户需要的搜索结果。
- 实例:奥迪q5汽车说明书系统自动切分成:奥迪、Q5、汽车和说明书四个词进行搜索。
汉语拼音
汉语拼音主要用在拼音分类和排序上。
- 常见的情形就是按字符串第一个汉字的拼音进行分类或排序。
- 按汉语拼音进行分类和排序最核心的是首先获取汉字的拼音字母。
- 根据字符串首汉字的拼音字母进行排序。
- 实例:品牌列表页面按品牌名称第一个汉字的拼音进行了分类并排序。
搜索技术
权重搜索的核心就是搜索结果的排序,换句话说,就是搜索结果要以什么关键因子排序。
- 核心权重因子:文档适用的型号、品牌和文档的类型。
- 权重值:对权重核心因子在排序中的重要性赋值。
- 排序:根据搜索结果的权重值进行排序,权重值最高的就是搜索最相关和最匹配的。
- 实例:佳能5d手册系统自动切分成:佳能、5D和手册三个词进行搜索。
- 搜索结果:包含佳能、5D和手册三个词的搜索结果最匹配,排在最前面,其中关键词用红色明示。