BillKnow.com

Who Know ? Bill Know!

Archive for 十二月 26th, 2007

26 十二月
0Comments

构建基于Web/XML多代理的信息集成研究

随着计算机技术,特别是Internet的不断发展,实现"信息孤岛"之间的集成与交互成为亟待解决的问题。

在诸多解决方案中, 基于多代理(Multi-Agent)的信息集成就是其中的一种。该系统已被认为是建造大型复杂分布式信息处理系统的重要技术和框架。在基于多代理的方法 中,资源集成的具体操作步骤是:用户把请求提交给搜索代理,由搜索代理对请求进行适当的转换,发送给代理路由器;代理路由器通过链接,将查询请求发送给数 据库代理;数据库代理接受查询请求,并进行具体的数据库操作,然后把查询结果返回给请求者;搜索代理对返回的结果进行识别,若存在所需的资源,则激活本地 数据库代理,对获得的信息进行记录,由专家系统对所搜集的信息进行进一步的处理。这种方法有一个明显的缺陷,即必须明确数据库的格式,代理才能正常工作。

而XML技术则可以很好的解决这个问题。用XML进行数据集成,只需对所有的异构数据源增加一个以XML为格式的封装体,即在不改变数据源的前提下,用 XML对数据源的定义描述字、数据源的创建等相关信息进行封装。供应链节点上所有数据源的封装体纳入全局的XML Schema或DTD,并存储在XML虚拟服务器,为系统检索、定位提供服务。在XML的集成机制里,可以通过XML封装体实现彼此之间的数据交互,所以 不需要了解数据库的格式,从而弥补了基于多代理的集成方法在这方面的不足。

下面首先概要介绍XML的相关技术,进而给出网络环境下的、基于XML的信息集成方案:包括系统的总体框图、层次结构、工作过程及系统主要组成部分的具体设计。

XML技术

1、XML相关标准

XML不仅仅是一种语言,广义的XML是一系列标准的集合。图1说明了XML及其相关标准,在图中,中间一层是XML基础标准,最下层是XML的应用标准。

 

  图1 XML相关标准

  

   XML基础标准是为XML的进一步实用化制定的标准,它规定了采用XML制定标准时的一些公用特征、方法或规则。XML Schema描述了更加严格定义XML文档的方法,以便可以更自动地处理XML文档。XML Namespace用于保证XML DTD中名字的一致性,以便不同的DTD中的名字在需要时 可以合并到一个文档中。DOM定义了一组与平台和语言无关的接口,以便程序和脚本能够动态访问和修改XML文档内容、结构及样式。 XQuery的目的是为从Web文档中提取数据,提供一种灵活的查询机制。XPath描述如何识别、选择、匹配XML文件中的各个构成元件,包括元素、属 性、文字内容等。XPointer和XLink标准,规定了有关定位、链接方面的内容。CSS被用来作为XML文档显示的样式标准等等。

  

  2、XML的主要技术特点

  

  XML是一种元标记语言,强调以数据为核心,这两大特点在XML的众多技术特点中最为突出,同时也奠定了XML在信息管理中的优势。

  

  XML是一种元标记语言

  

  与HTML不同,XML不是一种具体的标记语言,它没有固定的标记符号,是一种元标记语言,是一种用来定义标记的标记语言,它允许用户自己定义一套适于应用的DTD。

  

  XML的核心是数据

  

   在一个普通的文档里,往往混合有文档数据、文档结构、文档样式三个要素。而对于XML文档来说,数据是其核心。将样式与内容分离,是XML的巨大优点。 一方面可以使应用程序轻松的从文档中寻找并提取有用的数据信息,而不会迷失在混乱的各类标签中;另一方面,由于内容与样式的独立,也可以为同一内容套用各 种样式,使得显示方式更加丰富、快捷。

  

  3、DTD(Document Type Define,文档类型定义)

  

   DTD的作用是定义允许或不允许什么在文档中出现。DTD的结构:一般由元素类型声明、属性表声明、实体声明、记号声明等构成。一个典型的文档类型定义 文件会把未来所要创作的XML文档的元素结构、属性类型、实体引用等预先进行规定。用户既可以直接在XML文档中定义DTD,也可以通过URL引用外部的 DTD。DTD位XML文档的编写者和处理者提供了共同遵循的原则,使得与文档相关的各种工作有了统一的标准。

  

  基于XML的信息集成方案

  

  1、于XML的信息集成总体框图

  

   图2给出基于XML的信息集成的总体框图[1],是把来自供应链节点上的、不同数据源(数据库,构件库,领域知识库)的信息通过包装器 (Wrapper)转换成XML数据,存储在虚拟集中存储器中,用户通过DOM/SAX来获取已经转换成XML格式的信息;同样,用户通过DOM/SAX 接口提交的查询命令,通过包装器转换成本地数据源能够识别的数据格式进行查询。用户通过XML的封装体实现彼此之间的交互,而不需要了解对方的数据格式。

  

 

  图2 基于XML的信息集成总体框图

  

  2、基于XML的信息集成的层次结构

  

  如图3所示,整个信息集成可以分为三个层次:其中最底层为信息抽取层,中间为中介层,最上层为用户接口层。

  

 

  图3 基于XML的信息集成层次结构

  

  信息抽取层

  

   信息抽取层处于系统的最低层,是系统的数据提供者,主要功能是提取和集成分布在多个异构数据源(数据库,知识库及构件库)上的信息。这一层采用 Wrapper(包装器)技术实现将一个从中介层得到的查询,翻译成能在经过封装的数据源上执行的操作,将查询结果抽取并打包到一个XML文档,最后将该 文档返回给中介层。

  

  中介层

  

  中介层(Mediation Layer)的主要功能有两方面:一方面对上接受用户通过DOM客户端API向系统提交的或应用程序发出的查询,将其转换成对XML的查询,并将查询结果 返回给用户或应用程序;另一方面对下将XML查询分发给各个包装器,并将查询结果通过DTD说明再转换成XML格式。

  

  用户接口层

  

   用户接口层(User Interface Layer)在中介层之上,负责将用户的查询命令提交给中介层,获得并解释查询结果树,并将结果显示给用户。XML DOM(Document Object Model,文档对象模型)是为合法的格式良好的XML文档设计的一套API(Application Programming Interface,应用程序接口),它同时定义了这些文档的逻辑结构,访问及操作方法。由于数据显示与内容分开,XML定义的数据允许指定不同的显示方 式,使数据更合理的表现出来。本地的数据能够以客户配置,使用者选择或其他标准决定的方式动态的表现出来。CSS和XSL为数据的显示提供了公布的机制。

  

  整个系统位于异构数据源和应用程序之间,向下协调各种数据源,向上为访问集成数据的应用提供了统一的模式和访问的通用接口。系统为异构数据源提供高层次的检索服务。

  

  3、基于XML的信息集成的工作过程

  

  下面以用户的一个信息查询为例,简要说明一下信息系统的工作过程:

  

  用户通过DOM向系统提交信息查询命令;

  

  虚拟集中存储器区分各个XML查询命令,并且将其发送到适当的Wrapper包装器上;

  

  Wrapper包装器负责将XML查询转换成本地数据源能识别的语言,并在数据源中进行查询;

  

  查询结果根据DTD说明在转换成XML格式并返回给虚拟集中存储器由虚拟集中存储器返回给DOM;

  

  通过DOM对XML文档的处理,结合XSL技术将查询结果显示给用户。

  

  4、基于XML的信息集成系统的设计

  

  根据基于XML的信息集成的层次结构,下面给出包装器Wrapper组件的设计。

  

  包装器Wrapper组件的设计

  

   信息抽取层的Wrapper组件由两部分组成:Wrapper生成器和Wrapper实例(简称Wrapper)。如图4所示,一个Wrapper位于 中介层和一个数据源的中间,它通常为中介层查询异构信息源集合提供一个公共接口。每个Wrapper都要为某个特定的数据源制定相应的接口,这个功能是由 Wrapper生成器完成的。

  

 

  图4 Wrapper生成器和Wrapper

  

   Wrapper生成器用于为查询某个确定的站点或站点集合构建Wrapper。Wrapper的输入是用一种Wrapper规范语言书写的规格说明,包 括关于将要为之生成的Wrapper的数据源的元信息,该元信息描述了如何从一个数据源请求服务以及如何抽取和解释从数据源返回的信息。规格说明还必须能 够表达以下内容:数据源接口、数据模型、从用户到数据源本地操作的查询映射、数据源的查询能力。通常为一个数据源生成一个有效的Wrapper所必须的信 息是使用DTD来描述的。Wrapper生成器的输出是一个可以执行的 Wrapper,该Wrapper能够接受由Wrapper规范语言定义的查询。

  

  下面以数据库为例,给出对应的Wrapper相应的DTD:

  

  数据库

  

  一个关系Wrapper能决定关系模型和DOM对象数据模型之间的映射。关系表的数据模式可以用三层来表示,即表–记录–字段,因此可以很容易采用DTD来描述数据库中关系表的数据模式。

  

   下面以两个关系表Trait(PersonID, Name,BirthDate,Address,IdentifyId) 及 Treatment(TreatID,Drugname,TreatNote,PersonID)为例,他们与XML DTD之间的映射如下:

  

 

   在XML文档与数据库进行双向转化的过程中,除去最上层的根节点外,元素节点对应数据库中的表,属性和元素的类型对应表中的列,若一个元素节点为另一个 元素节点的子节点,则用数据库中的主码和外部码建立表之间的关系。在上面的例子中,元素节点Trait和Treatment对应数据库中的表,而 PersonID,Name等对应表中的列。

26 十二月
0Comments

XML打入互动电视

OpenTV提供了一套把电子信息服务和数字电视设备相融合的完备方案。OpenTV提供了 从前端服务器到数字机顶盒这一播送链路上的全部技术产品,还提供了在广播网络中创建服务内容的综合性工具。OpenTV和世界通用的广播标准(例如 DVB)、交互式电视标准(例如MHP)、Internet标准(例如HTTP、HTML、TCP/IP)等都是兼容的。

  OpenTV正在开发一系列专门的XML代理服务器,它们能够自动地把基于XML的应用(例如新闻、体育比赛、气象、股票)的代码转换为基于MPEG的Carousel格式。转换成的Carousel格式的服务内容可以用客户端的特殊浏览器进行浏览。

  当前工业界正在定义标准化的方式来描述服务。其中的成果之一是XSL,即扩展 Stylesheet语言。它一旦被完整地定义下来,就可以使服务提供商能够根据喜好来选择创作工具,定制自己所提供的服务的外观、感觉和浏览形式等等。 这样做的结果是产生通用XSL格式的应用程序,而由解释器来把它自动译成特定设备的运行代码。

  一旦XSL的创作工具产生,OpenTV就会把它添加到OpenAuthor中。此外,OpenTV正在它的操作系统一层添加对ITV特定标准格式的支持,包括DVB-MHP、ATSC DASE、ARIB BML。

  这些成果在CNN交互(CNN interactive)技术队伍与OpenTV之间的一个合作项目得到了很好的反映。该项目目的在于用OpenTV数字电视接收机来访问CNN网址内容。

  该项目最早提出的一个方案是,通过OpenTV的代理和机顶盒中集成HTML浏 览器来访问CNN网址。我们发现,即使机顶盒提供了对HTML语言的支持,因为CNN的 HTML网页的版面、导航条不适合于电视屏幕的显示,使用户对网页的浏览受到很大的限制。另外,HTML页面用遥控器也很难进行浏览的控制。HTML语言 标记之间缺乏语义连贯性,而OpenTV的代理服务器和代码解释器不能彻底弥补这一缺陷。为了仍旧能够用电视高质量地浏览CNN网页,就需要专门为电视设 计新的网页。这意味着除了现存的网址外,将不得不创建一个完全独立的新的网址——这将是一件极为昂贵并且浪费的事情。

  基于HTML的实验结果已经比较令人满意了,而更深入的分析发现,如果与 CNN交互式网站采用基于XML语言的连接,就可以在一个更加经济高效的基础设施上提供质量更好、更为灵活的网页浏览效果。通过与CNN交互式工程师的对 话,我们发现,CNN交互式网站的HTML页面是根据需要动态生成的。我们还发现,CNN的交互式数据库已经能够生成基于XML的服务内容。

  

  OpenTV互动电视解决流程示意图

  OpenTV以前曾开发过一个XML新闻服务器,它是CNN新闻数据库绝好的补 充。XML新闻代理每隔15分钟就和CNN交互式网站相连,以获取XML新闻格式的节目内容。OpenTV的XML新闻代理会自动地把XML语言的应用程 序翻译为OpenTV的新闻 Carousel格式。此后,这种格式的数据被送到OpenStreamer,复用成为MPEG流在数字电视网络上进行播送。(值得关注的是,CNN从数 据库中异步存取数据后,将立刻把数据传送给OpenTV的 XML新闻代理。在2秒钟以内,该实时更新的数据就开始在电视广播网络上播送了。)

  OpenTV还开发了一种客户端的新闻浏览器。用它能够进行OpenTV获取和浏览Carousel格式的新闻。值得指出的是,这种浏览器的外观可以完全由服务提供方进行定制,从而各具特色。

  基于XML语言的网页浏览有许多优势。使用XML语言,在CNN交互式网站一 方,不需要任何新的工程处理,网页内容也不需要重新创作。OpenTV的XML新闻代理产生的网页格式内容比HTML语言的更为精简,所以就更节约传输带 宽。使用XML语言的另一好处在于,OpenTV的新闻格式使得客户端不需要进行任何网页页面的排版处理。数字电视接收机的浏览器用户界面,可以进行一些 精细的调整,以达到最佳的显示和浏览效果。最后一点,用XML语言书写的内容可以重复使用,例如作为CNN交互式电视服务的升级版本中的一部分而被再次使 用。

  交互式电视产业最重视的交互式应用领域包括新闻、气象、体育比赛、广告、购物 和金融。OpenTV提供了这些应用领域与广播、Internet基础结构相融合的全部技术方案。OpenTV认为,融合的世界正在迅速形成,多种网络和 设备的天衣无缝的合作,令消费者可以随时随地获取电子应用服务。在技术各异的设备上,使用通用的XML语言可以高效,恰当地表示服务内容。

26 十二月
0Comments

校内网负责人许朝军谈我们信仰真实的社交网络

访谈嘉宾:千橡集团副总裁校内网负责人许朝军

主 持 人:天行健

整 理:草根帮主

访谈地点:草根网www.20ju.com的草根群

— 访谈开始 —

许朝军_校内网(xiaonei.com) 20:36:28

我们对互联网的看法:

1. 认为社交网络将会是继电子邮件,搜索,即时消息后,另一个核心基础的应用。
2. 我们信仰的社交网络是真实关系的社会网络,每个人现实生活中的关系:同学,同事,朋友等
3. 目前100步,我们才走了10步。需要更多的创新, 努力和耐心。

市场策略:

大学这个市场我们基本拿下,本月20号我们开通了80所高中和白领。

未来将会在提高这两个市场的渗透率。

由于资产的快速成长,给用户提供好的用户体验是我们最关注的问题。

天行健_草根网(20ju.com) 20:42:31
1、校内网的目标是最终覆盖所有的网民群体么,校内现在开战白领,猫扑和校内的用户更加重叠,你怎么看待这个问题

许朝军_校内网(xiaonei.com) 20:43:55
猫扑和校内满足的用户需求不一样,虽然有用户重叠。就像:可口可乐的可乐和她的美汁源,用户需求有差异性。

天行健_草根网(20ju.com) 20:44:41
我身边大学同学的几种校内体验现象:1.班级在校内建群了,要求班级同学加入 2.一男生通过校内认识一女生,然后到QQ上去聊,成了男女朋友 3.一女生在路上和另一女生说今天在校内看到院草了。 那么我想问的是:校内打开高中(白领)市场,我们都为高中的同学(白领)提供哪些产品呢,是否根据他们的特殊性提供了和大学用户不同的产品?校内预计高中 同学(白领)使用校内的网络行为是什么样的?

许朝军_校内网(xiaonei.com) 20:46:59
1. 校内群的功能满足n个人一起沟通互动的需求,所以这个人会建立群,当然也说明我们的班级产品和群产品有一些需求上的重叠;

2. 这个并不是校内网满足的核心需求,我们提倡用户找到现实生活中的朋友。最近我们在产品上做了升级,更加突出了这个核心需求。

3. 这个问题属于认识周围的新朋友,这个需求和现实生活类似。

至于高中(白领): 我想80%的产品都会比较共通,比如blog, 相册,搜索等等。

20%的产品可能会不同:比如如何提高白领的工作效率?

许朝军_校内网(xiaonei.com) 20:50:54
如何让高中生利用我们这个平台考上更好的大学等等 ,然运营上针对这三个人群会不太一样。

网络行为: 我们现在看到的数据是: 高中同学周末上的多,平时上的少一点; 白领平时上的多,周末上的少一点。

好友关系上: 高中生更多的是同班同学,初中同学,白领还有同事。

最后:这两块市场我们刚刚做,样本不是很大,具体的差别可能需要过一段时间会更准确。

天行健_草根网(20ju.com) 20:55:29
那基本上来看,高中生那块会做的类似于现在的校内,白领这一块可能会是linkedin的方向,是不是可以这么理解? 校内同时也希望这3类人群之间产生互动么?由此产品上准备进行什么调整呢?

许朝军_校内网(xiaonei.com) 20:59:49
加强基础产品的建设:
1. 最新的一个版本我们加强了隐私功能,隐私将会是一个持续的重点;
2. 加强搜索功能:让找到认识的人更加容易;

应用产品: web2.0一个很重要的是根据用户反馈来改产品。我们目前收到了高中和白领用户的一些反馈和建议,内部正在讨论,具体计划还没有定。

天行健_草根网(20ju.com) 21:02:05
刚才许总提到满足白领的工作上的需求,是不是意味着白领用户的需求满足将以商务和互助等为主,如果是,目前国外的商务sns发展都不是太好,校内有什么信心能够做到呢?

许朝军_校内网(xiaonei.com) 21:03:54
刚才讲到了,校内网的核心需求是满足和好朋友之间的日常生活的沟通,互动,分享。校内的基础产品将会提供。

国外的商务sns是满足商务生活的拓展。我刚才说的是有可能我们会做一些外围产品:比如: 地址簿,calendar等等。

我们坚信:核心产品将是一个基本需求,所以应该是核心产品为主,外围产品为辅。对国外的商务sns发展我本人也不是非常乐观。因为她提供的不是每天的需求。

天行健_草根网(20ju.com) 21:07:54
校内的白领战略发布之后,不少行业人士都认为校内的品牌并不适合这个市场战略,从刚才许总说的来看,似乎白领用户的产品会有一些新的功能,这样与 大学生和高中用户使用的产品会有一定区别。请问校内为什么不采用新的品牌,如果说是为了用户方便,也完全可以采用通行证来解决。

许朝军_校内网(xiaonei.com) 21:10:59
我们目前采用的方法是扩大对校内网进行诠释:人生就是一所学校,从一个地方毕业,然后进入一个新的地方。公司是一所学校,小区是一所学校。

商业历史上,在进行市场拓展的案例中,都不换品牌的,也有换品牌的,两者都有成功的案例。

我们现在采用的这个策略会在未来6-9个月后评估。

天行健_草根网(20ju.com) 21:14:10
当初校内在大学校园的推广相当成功,但是高中和白领群体所处的环境完全不同,校内当初的市场经验和强势渠道几乎无法借鉴和复用,不知道校内准备采用怎么样的市场策略和计划,以完成在高中和白领市场的扩张目标?

许朝军_校内网(xiaonei.com)
我们当初没有做这两块市场的时候,有很多高中生(他们的表哥表姐在用校内)和刚刚毕业的学生要求我们打开他们的学校或者公司。所以校内网在这两个人群中有了一些基础,会比当初更容易抓到第一批种子用户。

另外一点是:社会网络口碑传播会是一个大的来源。

我们将会在这点上非常重视,目前看来,这两块市场的自然增长超过我们的预期。

另外facebook在这两块的成功经验我们也会借鉴,再过半年,我可能可以更好地回答这个问题。

天行健_草根网(20ju.com) 21:20:36
我们知道,校内和5Q在发展大学生市场时候,采用了比较激进的策略,短时间用大量的投入完成了较高的市场占有率。如果高中和白领市场仅仅采用自然 增长,可能会发展的比较慢,随时也会面临其他竞争对手出现的威胁。校内在高中和白领市场的发展步骤、阶段预期目标是什么?为此准备投入多少人力、时间和资 金的预算?

许朝军_校内网(xiaonei.com) 21:21:41
这个属于商业秘密,暂时不能公布。抱歉。

天行健_草根网(20ju.com) 21:22:46
我们注意到,QQ也在做大学生社区QQ Campus,Facebook也即将进军中国,校内能够抵挡住这些大佬的威胁吗?同时市场上仍存在众多的SNS校园社区,如占座、优点、 Faceren(赛尔)、腾讯、亿聚等,校内在扩张其他市场时候,如何保持自己在大学生市场的领先地位?毕竟大学生在校时间一般只有4年,很多人都认为这 是一个流动的市场,而校内在高中市场的发展还属于未知

许朝军_校内网(xiaonei.com) 21:24:47
1. 过去在大学这个市场我们基本遥遥领先于对手,如果他们和我们提供的核心服务类似的话,他们的用户将会被我们吸引过来,所以在大学市场,我们更加专注于服务和产品,专注于用户体验。

2. 我们对待市场竞争非常欢迎:
1) 可以让我们团队更加有活力;2) 大家可以互相学习;3) 在高中,白领,真实的社交网络这个需求,这个市场需要大家一起来培育;

另外我们对竞争也非常偏执,内部要更加创新,更加有执行力,更加饥饿;外部:用户体验,产品一定要最好。

3. 团队
许朝军_校内网(xiaonei.com) 21:30:33
过去几年我们积累了一支可以打硬仗,有理想的团队,这是根本。我本人也是这样,信仰社交网络。

天行健_草根网(20ju.com) 21:34:22
在真实的社交网络的经营者中,近期还有一个备受瞩目的网站,就是前校内负责人王兴新创办的海内。近日海内打出了:从校内到海内,为就业做准备的宣传。许总怎么看待这种竞争。相信以后的竞争者会越来越多,校内为此做了哪些准备?

许朝军_校内网(xiaonei.com) 21:35:03
都是 facebook 150亿美金惹的祸,象去年youtube 16.5亿美金的收购一样, 国内一夜之间出现了很多视频网站。没有海内,也会有其他的出现。刚才那个问题,我讲到了,我们欢迎竞争。

未来几个月还会有更多的公司,创业团队会进入这个行业。

校内的准备:
1) 做好内部工作,内部激励,不要让我们的团队有动摇,有不少猎头在找我和我们的团队的人;
2) 深挖洞,广积粮

这场战争还会持续1年左右,并且会使竞争成本增加;

天行健_草根网(20ju.com) 21:43:35
作为sns领域的领先者,大家都很想知道校内网目前是否已经盈利,主要的收入来源和构成比例各是多少?预计稳定后的ARPU多少,毛利和净利润水平如何?

许朝军_校内网(xiaonei.com) 21:45:52
目前校内网在大学生这个群体占有率非常非常高,目前很多商家看重这个群体,象google, ipod, nike, adidas, 蒙牛,王老吉,伊利等等都持续在这个平台投放品牌广告。

下一步我们对精准广告很看好,因为我们是真实的社交网络,可以做到广告精准定位,这样广告的价值会比门户广告,搜索广告更加有效。

所以大家对facebook的估值这么高是有道理的,我们内部认为将来有可能facebook的商业价值会超过google!

针对个人用户收费我们比较谨慎,我们做了一些尝试,只是尝试。我们会一直保持谨慎,提供有价值的服务。

具体的财务数据不好透露,目前我们最重要的任务是做大校内的网络资产。

姚明在加入nba之前,最重要的任务是长好身体,提高球技,我们也是处在这个阶段。

天行健_草根网(20ju.com) 21:55:27
那许总给我们一些概念性的回答吧,做一个选择题和几个填空题:

1、是否盈利:是或者否
2、收入来源主要有哪些方式
3、各自的比例如何
4、校内认为合理的收入构成是什么样的

许朝军_校内网(xiaonei.com) 21:58:50
1、 如果停止对新市场的拓展,我们是盈利的;
2、 收入来源主要是品牌广告和个人增值,个人增值很少;
3、 品牌广告:个人增值 大约 10:1;
4、 我们认为广告的比例在未来1-2年还会持续增加;

天行健_草根网(20ju.com) 22:00:47
想了解一下校内网的网站架构,校内网的架构调整过几次,当数据达到千万级别,每日流量几百万IP的情况时,用什么方式来支持网站的正常访问。

许朝军_校内网(xiaonei.com) 22:01:18
我是搞技术出身的,很高兴回答这个问题。现在的解决方案是过去一步一步演化过来的。

我们有:

1. 一个好的load balance系统;
2. 一个分布式的cache系统,减少对数据库的查询,提高命中率;这是最关键的部分;
3. 分布式的存储系统,用户的UGC的存储的量每天很恐怖;
4. 搜索专门的解决方案;
5. 机器很多,实时的监控和冗余处理;

天行健_草根网(20ju.com) 22:08:38
校内目前使用了多少服务器和带宽,是否采用了集群和负载均衡?这是个引申问题,谢谢!

许朝军_校内网(xiaonei.com) 22:09:34
肯定采用了集群和负载均衡,不然会死得很惨,当访问量每增加5倍的时候,我们基本上要重构一次。带宽不好透露,服务器现在几百台的规模吧。

天行健_草根网(20ju.com) 22:12:56
业内有个较一致的观点,facebook之所以获得飞 速的发展和较高的估值,与facebook开放API有很大的关系,目前能看到开放本身对facebook的产品完善和用户增长都有很大帮助。校内作为 facebook理念的追随者,目前有没有这样的计划?有网友反映校内屏蔽所有竞争对手的网址,还有众多门户的博客地址,曾在博客质问校内为何不选择以开 放的心态做事呢。这么做是出于什么考虑呢?

许朝军_校内网(xiaonei.com) 22:14:26
facebook的开放api就像一个城市搞开发区一样,北京搞开发区很容易起来,我老家农村搞开发区很难搞起来。因为北京有很好的经济,人气,人才,环境等很多因素,很多人愿意来这里投资,建厂。

xiaonei开放api是一个时间问题,我们在评估。现在是否可以吸引很多公司和个人来这个开发区搞投资,建厂等等。

关于竞争对手网址我这里要借此机会澄清一下: 校内网现在有很多用户,有很多人在发一些广告信息和spam信息, 有的到了非常疯狂的地步。

还有我们涂鸦板的问题,有些代码会实现自动跳转.给用户体验及不好。这个方面确实很难处理。我也很头痛。社区大了后,很多人会利用他。我们在这个方面的管理水平要跟上,还有antispam系统也要跟上。

天行健_草根网(20ju.com) 22:22:31
这样似乎也说得过去,那校内有没有计划通过加入审核机制,针对一些优秀的公司和个人免费开放API?

许朝军_校内网(xiaonei.com) 22:23:20
内部正在讨论,暂时还没有详细时间表。如果有了,会让大家第一时间知道的。

天行健_草根网(20ju.com) 22:24:40

谢谢许总和各位草根网友的支持,因为时间有限,各位的问题不能一一满足,主持人提问阶段现在结束,下面进入自由讨论时间,请各位随便提问,多多交流。

许朝军_校内网(xiaonei.com) 22:25:16
校内网团队信仰web2.0, 信仰真实的社交网络,未来的路还很长,感谢大家给校内更多的耐心,理解和支持,我们一直在摸索,探索,在努力,痛并快乐着;

欢迎大家在校内网上找我,搜索我的名字 许朝军, 可以找到我。

26 十二月
0Comments

对Adobe Flex的十大误解

在Qcon上,Adobe的James Ward和InfoQ.com一起分享了他推广传播Flex应用框架过程中所遇到的对Adobe Flex的十大误解。
为了运行Flex应用程序用户需要安装新东西。

Ward向InfoQ.com独家论述了Flash采用比例和Flex编程模型:
Flex 2和Flex 3必需运行在Flash Player 9上。Flash Player 9运行时目前已经被安装在世界94%的计算机上:http://www.adobe.com/products/player_census /flashplayer/version_penetration.html

Flex 2和Flex 3的应用程序执行在Flash Player 9环境下。Flex应用程序构建在本地Flash Player API之上,如矢量图形、位图处理和网络(基于浏览器网络协议栈)。Flex框架增加了如日期选择器、数据表格、图表等可重用组件。编译Flex应用程序 的结果产生一个SWF文件,它是供Flash Player使用的二进制字节码格式。SWF文件包含的是Flex框架代码和项目自定义代码的字节码。Flex编译器对字节码进行了优化,只将要用的类编 译到SWF文件中。

对于桌面应用软件,Adobe的目标是推出自己名为Adobe AIR的新桌面运行时,希望能像Web运行时一样普及。Adobe AIR 1.0版本将于2008年初发布。目前,从labs.adobe.com上可得到的AIR是测试版。许多公司都已经在使用AIR构建产品软件。eBay的 应用程序eBay桌面就是一个例子。
Flash Player是100%私有的。

Ward继续为InfoQ.com做出说明:
Flash Player的核心是Tamarin虚拟机,这是Mozilla旗下的一个开源项目。而SWF文件格式不是完全开放的,它是由osflash.org社区 备案的。已有很多读写SWF文件的开源产品。Flash Player产品的发展方向在很大程度上受该社区及其需求所影响。Flash Player的核心语言是ECMAScript 262的一个实现,ECMAScript 262是JavaScript的规范。Flex还将CSS用于组件/应用的样式。Adobe AIR使用web标准以及开源技术如Tamarin、Webkit和SQLite作为其桌面应用的基础。

Flash是为设计者、视频准备的,而且让人讨厌。

2007年7月Ward在博客文章“我是如何克服对Flash的恐惧”中指出:
毋 庸置疑的,Flash的能力被滥用了。弹出窗口、跳过介绍和烦人的广告横行于我们的屏幕上。我曾听人们说过不应该因为一个宗教被滥用而否定它。这一格言同 样适用于技术。FLASH不能因为有些人拿它来做令人讨厌的东西而遭到摒弃。毕竟e-mail并没有因为垃圾邮件泛滥而消失。
Ward为InfoQ.com详细阐述了该主题:
传统的FLASH是用为设计者提供的基于时间轴的工具构建的。Flex是用于构建基于Flash的内容/应用的开发者工具套件。设计者和开发者通过共享两个工具之间的资源能够携手合作。Flex增加了一个全面的组件库:

http://www.adobe.com/go/flex_explorer_a pp
http://www.adobe.com/cfusion/exchange/index. cfm?event=productHome&exc=15&loc=en_us
Flex不是为企业/商业应用准备的。

在过去数周里,Ward 发布了关于Oracle在Adobe Flex之上实现大量新应用的七篇系列博客文章。这些应用软件近来公布在Oracle OpenWorld 上,其范围涉及从销售工具到数据库管理和商业智能。

除 了Oracle对Flex的使用,InfoQ.com也公布了一些使用Flex开发企业应用的团体。Ward也为InfoQ.com指出了很多使用 Adobe Flex开发企业级应用的例子,包括:Workday, SAP, Salesforce和Business Objects。

Flex太贵。

Ward详述了Adobe所做的一系列努力来消除公众对价格的误解:
Flex 是为构建Web和桌面的丰富互联网应用所提供的、免费的开发工具包,并且马上要开源。免费SDK包含了开发者构建RIA应用所需的一切,构建出的RIA应 用可在任何浏览器或操作系统上同样工作。免费Flex SDK的一部分部分是一套内容广泛的组件集,其可扩展、可更换皮肤且可访问。你可以在Flex组件资源管理器上看到很多这样的组 件:http://www.adobe.com/devnet/flex/samples/code_explorer/

Flex Builder是一个可选的Eclipse插件,这让使用免费Flex SDK开发应用软件更高效。它包括如集成调试、设计视图和代码补全等功能。

最近也采取了不少办法来调整Flex Builder的价格。Flex Builder现正免费提供给学生及教职人员。不带图表组件的vanilla版本Flex Builder,其价格已降至249美元,以此更好地平衡Flex Builder的价格等级。

还 有许多构建Flex应用后端基础结构的可选项。为了利用高性能AMF数据传输协议,有如LiveCycle数据服务这样的官方Adobe产品,以及如 Granite数据服务这样的众多开源项目。使用AMF消除了以下不必要的步骤:从数据转换为文本(SOAP, RESTful 等),传送,然后再由文本转换回数据。AMF还允许在线传送中保存类型信息。
关于AMF 和其他基于文本序列化技术的比较,请看James Ward的RIA基准应用系统普查:http://www.jamesward.org/census.

Flex的应用程序需要专用服务器。

Ward再次为InfoQ.com讲述:
Flex 应用程序可以运行在任何Web服务器,应用服务器和数据库服务器之上。Flex应用程序更像是客户端-服务器应用程序。由于逻辑是运行在Flash Player客户端内,你需要某种方式来与服务器交互。你可以有很多不同的选择将Flex连接到你的基础结构。不需要任何专用库,你可以将你的后端数据和 服务暴露为RESTful、XML或SOAP,并且很容易在你的Flex应用中消费这些数据。如果选择使用AMF二进制序列化协议,你可能需要添加一些额 外的库到你的web应用软件。AMF只是另外一种序列化技术,就如XML或JSON 一样,所以它可以作为你用于和后端SOA沟通的多样方式中的一种。
Flex很难学。

InfoQ.com社区的Leftie Friele,就InfoQ.com文章"谁在使用Flex?" 发表了评论,详述了他的公司在学习Flex上的经验:
我们初创公司Ezmo在开创以来就在使用Flex,我们非常愉快的使用该框架。

不需要任何Flex/Flash的预备知识,我们可以在少于两周之内构建出我们的应用程序。Java和Flex之间的整合更是超级简单,开始使用Flex就像是公园漫步。

说到工具支持, Flex Builder也是相当不错。如果你熟悉Eclipse环境,你能顺利起飞,不会碰到任何问题。唯一缺憾是缺少更好的持续集成工具和更好的Maven插件来构建Flex应用。
对于Flex新手们,Ward给了一段截屏录像,展示了一个Flex应用的构建过程,以帮助你起步。此外,还有许多关于使用Flex和Java的其他文章在 Adobe Developer Connection上 。

使用Flex,我需要重建我的整个应用。

今 年1月,Bruce Eckel发表了一篇题目为"混合Java" 的文章。文章中他认为Java团体应该继续使用Java好的方面,但是也应该采用其他技术来替代Java薄弱的方面。文中主要焦点是使用Adobe Flex作为用户界面来取代传统的Java选项(Swing、JSF等……)

Ward详细阐述了这一概念:
既然Flex应用程序只是应用程序的UI端,而后端通常都是一样的。如果你的后端是依照SOA模式构建的,那么通常很容易将这些服务暴露给一个新的Flex UI。这将保持你现有的商业逻辑不变,无论它使用的是EJB、Spring服务还是POJO。
Flex打破了常规的浏览习惯,象后退按钮。

Ward的博文讨论了后退按钮:
Flex已经内建了对后退按钮的支持且非常容易定制,因此这已不再是问题。Flex也提供了一个简单的办法来处理“#”url(或命名的锚点),url随应用状态的变化而变化。另一个Web 1.0的整合问题业已解决。
Ward为InfoQ.com补充了更多的细节:
Flex 3给应用提供了一个简单的方式在命名的锚点中储存状态参数,当该URL被请求时可以根据这些参数正确地恢复状态。有关这一特点的更多信息可以参见Flex 3特性介绍:深连接专题介绍文档。

可 访问性对Flex应用来说一直是非常重要。因为Flash Player与Jaws及其他可访问性技术一起工作的,因此为基于Flash的应用程序增加可访问性的能力已经具备了。Flex框架将可访问性纳入核心框 架。有许多不同方面的可访问性,这取决于你的应用程序需要支持什么样的损伤和残疾。你可以在开发者指南中找到更多有关Flex可访问性特性的信息。
Flex能做到的,Ajax也能做到。

Ward解释说:
Flex RIA和Ajax不是非此即彼的关系。像Google Finance网站就展示了如何同时使用Flex和Ajax。Ajax非常适合以内容为中心的应用,而Flex则适合于互动,媒体和数据为中心的应用。如 果你的应用介于这两者之间,那么你可以用Flex Ajax Bridge来结合这两种技术。在 Flex 3里,Flex Ajax Bridge已经直接集成到SDK中。如果使用的Flex 2,你将需要单独下载Flex Ajax Bridge。