上海市科学技术委员会资助项目(065115020)
- 作品数:6 被引量:46H指数:4
- 相关作者:李翔林祥钟宝燕金晓鸥申伟更多>>
- 相关机构:上海交通大学上海政法学院更多>>
- 发文基金:上海市科学技术委员会资助项目国家自然科学基金教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术更多>>
- 互联网媒体信息热点主动发现技术研究与应用被引量:5
- 2009年
- 网络媒体庞大的信息量及信息内容的各异,并不能把传媒聚类算法中适用于文本信息聚类的基本划分方法直接应用于互联网媒体信息热点生动发现的研究工作中。鉴于此,文中将基于密度的聚类思想引入CFK-Means算法,创造性地提出了全新的DCFK聚类算法。与此同时,文中基于DCFK算法构造大规模中文信息聚类模型,并且通过系列实验验证本聚类模型在互联网媒体信息主动热点发现领域的有效性和实用性。
- 黄宇栋李翔林祥
- 基于Rhino的JavaScript动态页面解析研究与实现被引量:21
- 2008年
- 面对互联网上占据全国页面总数50%以上的动态页面,当前网络舆情管控工作中的信息采集环节对以动态页面为主要发布形态的互联网媒体无法实现信息获取。鉴于此,文中提出了基于Rhino实现JavaScript动态页面解析的整体方案。实验结果表明该方案充分丰富了互联网舆情管控工作的数据源对象,是实现动态页面内超链接网络地址递归获取和网页主体内容提取行之有效的解决方案。
- 金晓鸥钟宝燕李翔
- 基于内容协商实时在线翻译方案的实现及分析被引量:1
- 2008年
- 互联网上大量的信息往往以不同种的语言出现,为了在尽可能短的时间内了解这些信息,也为了在互联网舆情管控领域的中文文本处理中使用这些信息文本,需要借助于在线实时网页翻译。文中在分析了传统网页翻译方法的不足后,提出了基于内容协商和网络缓存的网页实时在线翻译系统的方案,使得翻译服务对于客户端透明,节省客户端多余操作时间,同时使得对于重复请求的网页呈现效率得以提高。并通过分析和实验证实了该方案相对于传统网页翻译方法的优越性。
- 王仆钟宝燕李翔李建华
- 关键词:网页翻译网络缓存
- 基于Cookie的身份认证网站信息采集研究与实现被引量:12
- 2009年
- 越来越多的需要认证才能访问的网站,对互联网内容安全管控平台中的网络信息采集单元提出了更高的要求。考虑到传统网络信息采集系统在应对身份认证网站时表现出的不足,基于Cookie内容协商机制,首创性地提出了面向身份认证网站发布信息的普适采集方案,并通过系列实验证明该信息采集方案的有效性与实用性。
- 申伟李翔林祥
- 关键词:COOKIE信息采集
- 基于AOP的角色访问控制模型设计与实现被引量:7
- 2008年
- 随着信息技术的不断发展,用户可访问的信息资源越来越复杂,越来越难以管理。当前,在Web信息系统开发中,角色访问控制已经成为了一个研究热点。介绍了角色访问控制(RBAC)、AOP以及AspectJ的相关知识;根据RBAC的基本理论,以笔者曾参与开发的一个Web信息系统为原型,给出了一个基于角色-表单模型的设计,并采用AOP技术,给出了相应的实现方案。
- 尹涛李翔林祥魏诚
- 关键词:面向方面编程ASPECTJ
- 基于JSSh实现身份认证网站信息采集
- 2009年
- 网络媒体监控系统需要对部分网站进行自动身份认证和网页采集。受到Web自动化功能测试的启发,文中提出了基于JSSh(JavaScript Shell Server)实现身份认证网站发布信息采集方案。最后通过实验证明,与重构身份认证过程数据包交互方式相比,基于JSSh实现身份认证网站发布信息采集的普适性更强,并且实现过程更为简单。实验表明,该方案身份认证成功率高,采集效率也符合网络媒体监控系统对于信息采集实效性的要求。
- 万久士李翔林祥
- 关键词:身份认证信息采集