八月 20, 2008

Googlebot是Nokia6820

偶然查看网站日志,发现以下类似记录:
66.249.71.146 - - [18/Aug/2008:03:44:43 +0000] "GET /main/wap/index.php?p=76 HTTP/1.1" 200 11226 "-" "Nokia6820/2.0 (4.83) Profile/MIDP-1.0 Configuration/CLDC-1.0 (compatible; Googlebot-Mobile/2.1; +http://www.google.com/bot.html)"
66.249.71.144 - - [18/Aug/2008:03:45:11 +0000] "GET /main/wap/?paged=2 HTTP/1.1" 302 9078 "-" "Nokia6820/2.0 (4.83) Profile/MIDP-1.0 Configuration/CLDC-1.0 (compatible; Googlebot-Mobile/2.1; +http://www.google.com/bot.html)"

Google的移动抓住工具很有意思,还是Nokia6820。可能Googlebot的确是在模仿各种手机的浏览,让他的抓住工具看起来更像真实的手机,而不是机器人爬行。

标签: , ,

固定链接-

八月 17, 2008

Web标准发展建议和实例 XHTML

使用HTML4.01是能够制作出现代的、结构化的、兼容标准的站点的。然而,为了做到向整洁的语义化的代码的转变,并且为XML和未来的其他标记语言做好准备,建议大家使用XHTML1.0 Strict来创建新的站点,本文中的例子用的就是XHTML1.0 Strict。


XHTML 1.0 是以XML 1.0对HTML 4的改进,他的发展,以用来代替HTML。XHTML 1.0 Strict(这是我一直所倡导的)不支持表现类的标记(HTML 4.01其实也不支持,但是现在我们讨论的是XHTML)。正因为此,XHTML1.0 Strict 就促使了表现和结构的分离。



XHTML 1.1(XHTML的最新版)从技术上说,使用起来有一些复杂。因为规定中声明XHTML 1.1的文档应当使用MIME类型 application/xhtml+xml, 不应当被看作text/html。 并不是严格的禁止使用text/html, 只是不建议使用。 另外一方面,XHTML 1.0 (应当使用 application/xhtml+xml)同样能够使用MIME类型 text/html, 假如他是可兼容的HTML。W3C的注解XHTML Media Types 中包括了MIME类型(W3C推荐使用的类型)的概要。


不幸的是,一些老的浏览器包括IE不能识别MIME类型 application/xhtml+xml, 并且会终止显示源代码,甚至会干脆拒绝显示整个文档。


假如您想使用application/xhtml+xml, 您应当让服务器检验一下读取文档的浏览器是否支持MIME类型,假如能,就使用偃绮荒埽褪褂胻ext/html。


假如您使用的是PHP作为服务器端的脚本,那么下面的这段脚本能够让您的文档针对不同的浏览器使用不同的MIME类型。


<?php if (stristr($_SERVER[HTTP_ACCEPT], "application/xhtml+xml") || stristr($_SERVER["HTTP_USER_AGENT"],"W3C_Validator"))
{ header("Content-Type: application/xhtml+xml; charset=iso-8859-1");
header("Vary: Accept");
echo("<?xml version=\"1.0\" encoding=\"iso-8859-1\"?>\n");
} else { header("Content-Type: text/html; charset=iso-8859-1");
header("Vary: Accept"); } ?>



这个脚本是检测是否用户代理发送了一个包含“application/xhtml+xml”的Accept HTTP头,或假如用户代理是W3C HTML校验器(不会发送合适的Accept HTTP头的,但是他依然支持 application/xhtml+xml)。假如上面检测的回答是肯定的,文本将被看作 application/xhtml+xml。那些浏览器也会收到一个XML的声明。对于另外的一些浏览器(包括IE的是任何版本),文档都将被看做 text/html。在文档中也没有添加额外的XML声明,因为假如添加的话,会使IE/WIN转化到我们所不希望的Quirks模式。


在Content-Type头部之后,一个被更改过的头部,将被发送到中间的缓存中(比如一些代理服务器),用来告诉他们文档的内容类型随着客户端对文档的请求而改变。


假如想了解更多的PHP检测脚本, 请参考Serving up XHTML with the correct MIME type. 那个脚本对请求客户端的q-rating(他声明了更够很好的支持某种MIME类型)进行了考虑,在发送text/html 文档给不支持 application/xhtml+xml的客户端之前,把XHTML转化成HTML 4。


下面的是个相似的脚本,针对ASP(VBSscript):

<% If InStr(Request.ServerVariables("HTTP_ACCEPT"), "application/xhtml+xml") > 0 Or InStr(Request.ServerVariables("HTTP_USER_AGENT"), "W3C_Validator") > 0 Then Response.ContentType = "application/xhtml+xml" Response.Write("<?xml version=""1.0"" encoding=""iso-8859-1""?>" & VBCrLf); Else Response.ContentType = "text/html" End If Response.Charset = "iso-8859-1" %>

值得注意的是,当一个文档的MIME type是application/xhtml+xml时,一些浏览器(像Mozilla)是不会显示包含错误的文档的。这在研发过程中是一件好事,但是对于那些刚刚更新完站点且不是XHTML专家的人来说,就会出现一些问题,除非您能确保任何的代码都是规范的。假如出现了这种问题,您能够考虑使用HTML 4.01 Strict来代替XHTML。


下面列出了一些在使用XHTML 1.0 Strict中需要特别注意的地方:




  • 永远使用小写字母,让引号伴随者属性: 任何元素和属性的名字都必须使用小写,任何属性值必须使用双引号。


    错误: <A HREF="index.html" CLASS=internal>
    正确: <a href="index.html" class="internal">




  • 关闭任何的元素:在HTML中一些元素没有必要被关闭。当下一个元素开始的时候,上一个元素就自动被关闭。XHTML中是不允许这样的。任何元素都必须被关闭,即使其中没有内容(如 <img>)


    错误: <li>Item 1
    正确: <li>Item 1</li>



    错误: <p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.
    正确: <p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.</p>


    错误: <br>
    正确: <br />



    错误: <img src="image.jpg" alt="">
    正确: <img src="image.jpg" alt="" />



  • 属性不能被缩减: 在HTML里,一些属性能够被缩减。而XHTML则不允许这样做。


    错误: <input type="checkbox" id="checkbox1" name="checkbox1" checked>
    正确: <input type="checkbox" id="checkbox1" name="checkbox1" checked="checked" />




  • 不要使用被排斥的元素: 一些元素和属性在HTML 4.01 Transitional和XHTML 1.0 Transitional是被允许的,而在XHTML 1.0 Strict下则不被支持(更有in HTML 4.01 Strict)。比如<font>、<center>、 alink、align、width、 height (对于某些元素)和 background。

标签: , ,

固定链接-

XHTML 和 MIME 类型 - 使用Web 标准生成 ASP.NET 2.0 Web 站点

当 Web 浏览器从 Web 服务器请求页时,Web 服务器会为该页分配特定的 MIME 类型(也称为 Content 类型)。例如,HTML 页被分配为 text/html MIME 类型,GIF 图像被分配为 image/gif MIME 类型,而 Microsoft Word 文档被分配为 application/msword MIME 类型。



浏览器使用 MIME 类型来确定如何处理页(或其他资源)。例如,如果浏览器从 Web 服务器获得一个具有可识别图像 MIME 类型的文件,则浏览器尝试将该文件解释并呈现为图像。如果浏览器获得一个具有 application/msword MIME 类型的文件,则该浏览器可能自动打开 Microsoft Word 以显示该文档(这里的确切行为取决于浏览器及其配置方式)。



W3C 为 XHTML 文档引入了一个 MIME 类型。这一新的 MIME 类型是 application/xhtml+xml。W3C 建议您在提供 XHTML 文档时使用 application/xhtml+xml MIME 类型,因为 XHTML 页应该以比旧式 HTML 页更严格的方式进行解释。



通过在页指令中包含 ContentType 属性,为 ASP.NET 页分配特定的 MIME 类型。例如,在 ASP.NET 页的顶部包含以下指令会导致为该页分配 application/xhtml+xml 类型。


<%@ ContentType="application/xhtml+xml" %>






W3C 的推荐标准有一个突出问题:并非所有浏览器都能识别 application/xhtml+xml。特别需要指出的是,Internet Explorer(有史以来最为流行的 Web 浏览器)不能识别 application/xhtml+xml MIME 类型。因此,使用推荐的 application/xhtml+xml MIME 类型提供 XHTML 页不是一个可行的选择。



有三种解决该问题的方式。可以使用 text/html MIME 类型来提供 XHTML 页,或者使用 application/xml(或 text/xml)MIME 类型来提供 XHTML 页,也可以使用内容协商方式。让我们对上述每个选择进行探讨。




第一个选择 — 以 text/html 类型提供页 — 是最容易的选择。默认情况下,ASP.NET 页被分配为该 MIME 类型。更好的做法是,按照 W3C 的建议,在向现有的 HTML 浏览器提供页时使用这一选择(请参阅 http://www.w3.org/TR/xhtml-media-types/)。如果创建的是 XHTML 1.0 Transitional 页,并且 Web 应用程序的主要受众使用不能理解 application/xhtml+xml MIME 类型的浏览器,那么以 text/html 类型提供页似乎十分明智。毕竟,引入 XHTML 1.0 Transitional 标准的目的是使开发人员能够更为容易地将现有的 HTML 页迁移到 XHTML。



这一主张是有争议的。例如,Ian Hickson 认为,绝不应该以 text/html 类型提供 XHTML 页,因为这样会导致随便的、不标准的 XHTML 页(请参阅 http://hixie.ch/advocacy/xhtml)。他建议作者们继续坚持使用 HTML 4.0,直到更多的浏览器完全支持 XHTML 标准为止。



第二个选择是使用 application/xml 或 text/xml MIME 类型,以 XML 类型提供 XHTML 页。在向 Internet Explorer 提供 XML 文档时,该文档会作为 XML 文档进行分析并呈现到浏览器中。(该文档由 document.XMLDocument 对象公开的 XML DOM 表示。)



以 XML 类型提供 XHTML 文档的优点是,XHTML 文档具有的任何问题都会被 Internet Explorer 的 XML 分析器捕获。例如,如果文档包含重叠标记,或者如果没有将属性的值包装到引号内,则不会呈现该文档,并且会显示错误信息(参见图 4)。XHTML 纯粹主义者认为该行为是一件好事,因为它可以防止您编写格式错误的 XHTML。








图 4. 在 Internet Explorer 中显示 XML





该方法的问题是:默认情况下,Internet Explorer 呈现 XML 文档的源代码。因此,如果以 XML 类型提供 XHTML 文档,则 Web 站点访问者将看到 XHTML 文档的源代码,而不是预期的呈现输出。W3C 推荐了一个用来解决该问题的“窍门”(请参阅 http://www.w3.org/MarkUp/2004/xhtml-faq#ie):如果通过使用 XSLT 转换将 XHTML 文档转换为 HTML,那么文档将分析为 XML 并显示为 HTML。



例如,清单 1 中的 ASP.NET 页将以 XML 文档的形式提供,但被转换为 HTML 文档。结果页会正确地显示在 Internet Explorer、Opera 和 Firefox 中。



清单 1. XMLPage.aspx


<%@ Page Language="VB" ContentType="text/xml" %>

<?xml-stylesheet type="text/xsl" href="copy.xsl"?>

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"

"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">


<html xmlns="http://www.w3.org/1999/xhtml" >

<head runat="server">

<title>My Page</title>

</head>

<body>


<form id="form1" runat="server">

<div>

<asp:TextBox ID="txtFirstName" runat="server" />

</div>

</form>

</body>


</html>






页指令会导致该页以 text/xml 类型呈现。清单中的第二行引用了一个名为 copy.xsl 的 XSLT 样式表,它会对当前文档执行标识转换。换句话说,除了将原始XML 文档中的所有元素复制到新的 HTML 文档中以外,它根本没有做任何事情。copy.xsl 的源代码包含在清单 2 中。



清单 2. Copy.xsl


<stylesheet version="1.0"


xmlns="http://www.w3.org/1999/XSL/Transform">

<template match="/">

<copy-of select="."/>

</template>

</stylesheet>







该解决方案是有效的,但它似乎不是很精彩。当分析 XML 文档时,的确获得了额外的验证步骤。但是,如果在 Visual Studio .NET 2005 或 Visual Web Developer 中生成 ASP.NET 页,那么开发环境会在“Source”视图中执行相同的验证。最后,Internet Explorer 将收到与向它发送 text/html 类型文档时相同的文档。



第三个选择 — 内容协商,将 W3C 推荐标准的精神与最大程度的浏览器兼容性最佳地组合在一起(请参阅 http://www.w3.org/2003/01/xhtml-mimetype/content-negotiation)。当使用内容协商时,会以不同的 MIME 类型向不同的浏览器提供 ASP.NET 页。如果浏览器声称它支持 XHTML,则向它提供 XHTML 类型的页;否则,以 text/html MIME 类型向该浏览器提供页。



清单 3 中的 Global.asax 包含向不同的浏览器提供不同 MIME 类型页所需的代码。如果将该文件添加到 Web 项目中,则每个 ASP.NET 页的 MIME 类型都会随着每个请求而修改。将页提供给 Firefox 或 Opera 时,该页以 application/xhtml+xml 类型提供。另一方面,Internet Explorer 6 会收到 text/html 页。



清单 3. Global.asax






<script runat="server">

Sub Application_PreSendRequestHeaders(ByVal s As Object, _

ByVal e As EventArgs)

If Array.IndexOf(Request.AcceptTypes, _

"application/xhtml+xml") > -1 Then


Response.ContentType = "application/xhtml+xml"

End If

End Sub

</script>




转自:http://www.flywe.net/article.asp?id=133

标签: , ,

固定链接-

八月 16, 2008

打造W3C XHTML 1.0标准的网站

XHTML1.0是HTML4.0的重新组织,算是HTML4.01的修正版,发行命名为XHTML1.0。
XHTML1.0要求比较严格,跟HTML4.01有些差别,以XHTML1.0标准下列1-4项是绝对必要的也是不同于HTML4.01的地方。
网页制作使用Dreamweaver MX 2004,可以在
「编辑」-「偏好设定」-「新文件」-「将文件设为XHTML兼容」,然后新增HTML,就可以开始制作XHTML的网页。 以下我列出几点比较常见会发生的错误供参考:

1.所有卷标元素名称都使用小写
错误 <HTML> <TITLE> <HEAD> <BODY>
正确 <html> <title> <head> <body>
错误 <IMG src=”BG.GIF” BORDER=”0″ ALT=”说明文字”>
正确 <img src=”bg.gif” border=”0″ alt=”说明文字” />
错误 <UL><LI></LI></UL>
正确 <ul><li></li></ul>
以上只是举例,是”所有”卷标元素名称都必须是小写。

2.所有没有成对的空标签必须以 />结尾,<p></p>和<a href=”home.html”></a>。

这就是成对错误: <br> <hr>
正确 <br /> <hr />
错误 <input type=”text” name=”name”>
正确 <input type=”text” name=”name” />
错误 <meta …>
正确 <meta … />
错误 <link rel=”stylesheet” type=”text/css” href=”style.css”>
正确 <link rel=”stylesheet” type=”text/css” href=”style.css” />
错误 <img src=”bg.gif” border=”0″ alt=”说明文字”>
正确 <img src=”bg.gif” border=”0″ alt=”说明文字” /> 3.不允许使用target=”_blank”
在HTML4.01可以使用target=”_blank”,
但XHTML1.0是不被允许的,你可以改写为 target=”new”

4.所有属性都必须有值
XHTML1.0规定所有属性都必须有值,若没有就必须重复属性作为值
错误 <input type=”radio” value=”v1″ checked name=”s1″ />
正确 <input type=”radio” value=”v1″ checked=”checked” name=”s1″ />
错误 <option selected>S1</option>
正确 <option selected=”selected”>S1</option>
错误 <td nowrap>
正确 <td nowrap=”nowrap”>

5.非卷标一部分的符号以编码表示
窗体内包含以下符号也必须用编码表示
< 以 < 表示
> 以 > 表示
& 以 & 表示
程序中的连结 & 也要改用 &
错误 <a href=”foo.cgi?chapter=1&section=2″>
正确 <a href=”foo.cgi?chapter=1&section=2″>

6.使用表格常犯的错误
我们在做表格通常会指定宽与高,例如:
<table border=”1″ width=”300″ height=”55″>
<tr><td> 内容 </td></tr>
</table>
这样做是没有办法通过,W3C建议使用CSS来控制卷标元素的高度
.table{
height:55px;
}
<table class=”table”>
<tr><td> TEXT </td></tr>
</table>
但是若使用太多表格,在CSS一一指定不同高,也不是好方法
其实很简单将高度height属性指定在储存格就可以了通过测试
<table border=”0″ width=”300″>
<tr><td height=”55″> TEXT </td></tr>
</table>
但这不是w3c希望的标准,建议能够使用div代替不必要的table

7.正确使用CSS样式表
一定要放在<head></head>之间
<link rel=”stylesheet” type=”text/css” href=”style.css” />
<style type=”text/css”>
<!–
body{font-size:9pt;}
–>
</style>

错误 <style>
正确 <style type=”text/css”>
建议全站的样式都写在.css文件中

8.同一个id选择器不可重复使用
一个网页中id=”xx”同一个选择器不能重复使用,若需要重复请用class=”xx”

9.绝对不可省略双引号或单引号
错误 style=font-size:9pt
正确 style=”font-size:9pt”
错误 <img src=bg.gif width=140 height=30 alt=text />
正确 <img src=”bg.gif” width=”140″ height=”30″ alt=”text” />
错误 <a href=home>text</a>
正确 <a href=”home”>text</a>

10.标签必须是一对
<p> </p>
<span></span>
<div></div>

11.图片卷标加上文字说明alt=”说明”
错误 <img src=”bg.gif” height=”50″ border=”0″ />
正确 <img src=”bg.gif” height=”50″ border=”0″ alt=”说明文字” />

12.正确的卷标顺序
错误 <b><i>文字</b></i>
正确 <b><i>文字</i></b>

13.批注文字不可包含–符号
错误 <!– OEC–SPACE –>
正确 <!– OECSPACE –>

14.JavaScript写法
Javascript我们通常会写为
错误 <script language=”javascript”>
W3C标准必须为程序指定类型type=text/javascript,所以要写为
正确 <script type=”text/javascript”>
或者 <script language=”javascript” type=”text/javascript”>
载入外部.js独立档案的写法
正确 <script type=”text/javascript” src=”script.js”></script>

15. <embed>标签的争议
<embed>是Netscape的私有标签,W3C 从HTML3.2 HTML 4.01 到 XHTML 1.0 中都没有这个标签,所以使用<embed>的页面是不能通过标准测试。
W3C推荐使用 <object> 标签,用<object>插入flash影片的代码可以写为:
<object type=”application/x-shockwave-flash” data=”index.swf” width=”400″ height=”200″>
<param name=”movie” value=”index.swf” />
</object>
但这样的写法可能IE5/IE6 Win浏览器版本会出现问题。想要符合标准又能在任何浏览器下正常显示,以下几个连结点提供参考:以下几个连结点提供参考:

torresburriel.com
A List Apart

<embed>标签因为广大的受到运用,不再标准范围引起很大的争议,想要解决这个问题,只能等IE浏览器对<object>有更好的支持或者W3C愿意收录<embed>标签。

16. XHTML 1.0文件类别宣告的正确写法 (不可小写)
用于一般网页
<!DOCTYPE html PUBLIC “-//W3C//DTD XHTML 1.0 Transitional//EN”
“http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd”>

用于框架页
<!DOCTYPE html PUBLIC “-//W3C//DTD XHTML 1.0 Frameset//EN”
“http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd”>
W3C标准测试网址 http://validator.w3.org/
网页自动测试网址 http://validator.w3.org/check?uri=referer
测试时一定要有「16.文件类别宣告」还有指定文件编码
<meta http-equiv=”Content-Type” content=”text/html; charset=big5″ />
才能顺利进行测试动作,开始打造一个万维标准的网站吧!

标签: , ,

固定链接-

八月 12, 2008

《Google网站管理员指南》名言

Google网站管理员指南》名言:请不要为了提高搜索引擎排名而弄虚作假。 一个简单分辨是非的方法是:您是否可以坦然地跟竞争对手网站解释您对网站所做的事情。 另一个有用的测试手段即扪心自问:"这能否给我的用户带来帮助? 如果不存在搜索引擎,我是否还会这样做?"

标签: , , , ,

固定链接-

八月 06, 2008

Transitional vs. Strict Markup

推广Web Standards的人经常说XHTMLHTML更加严格,当然从某种意义上说是的,比如它要求所有的标签关闭并且所有的属性都用引号。但其实XHTML 1.0还分两种(加上Frameset DOCTYPE的话算三种,本文不讨论),Transitional(过渡型)和Strict(严格)DOCTYPEs。并且HTML 4.01也有同样的文档声明。


从字面上就可以看出来意思:Transitional DOCTYPEs只是为了实现从旧时代到新时代的过渡,而且Strict DOCTYPEs是默认的文档声明, 对构造HTML 4.01XHTML 1.0都适用。


使用Transitional DOCTYPE一般是由于代码中含有过多陈旧的写法,并且一下子很难完全转换到Strict DOCTYPE来。但是Strict DOCTYPE才应该是你的目标。它鼓励甚至有时是强迫你把结构与表现区分开来,把表现层的代码都写在CSS里。HTML 4 Document Type Definition: -


本HTML 4.01 Strict DTD不包括表现层属性和标签,W3C将逐渐淘汰这些属性和标签,您完全可以使用样式表来实现。您应该使用Strict DTD,如需获得表现层属性和标签的支持,请使用Transitional DTD。



Strict DOCTYPE还有一个好处,即可以让浏览器使用它们最严格、(一定程度上)最符合标准的模式来渲染页面。


Tommy Olsson在Web Standards Group的Ten questions for Tommy Olsson一文中很好的阐述了使用Strict的好处:


我觉得,使用Strict DTD,无论是HTML 4.01 Strict还是XHTML 1.0 Strict,远比讨论是用HTML还是XHTML重要的多。它代表了未来互联网的质量。它将结构和表现分开,使得维护一个站点非常容易。



对于刚开始接触web standards和正确的、语义化的结构的人,认清Transitional和Strict DOCTYPEs的区别非常重要。更多详细列表请参考:XHTML: Differences between Strict & TransitionalComparison of Strict and Transitional XHTMLXHTML1.0 Element Attributes by DTD


对于准备向Strict进发的人来说,两者的有些区别很可能会使开发者犯错误,接下来我将会谈到。


Strict DOCTYPEs下不支持的标签



  • center

  • font

  • iframe

  • srike

  • u


Strict DOCTYPEs下不支持的属性



  • align (表格相关的支持:col, colgroup, tbody, td, tfoot, th, thead, and tr)

  • language

  • background

  • bgcolor

  • border (table支持)

  • height (imgobject支持)

  • hspace

  • name (在HTML 4.01 Strict中支持,XHTML 1.0 Strict中的formimg不支持)

  • noshade

  • nowrap

  • target

  • text, link, vlink, 和alink

  • vspace

  • width (img, object, table, col, 和 colgroup都支持)


内容模型的区别


元素类型的内容模型描述了什么样的元素类型实例可以被包含。这一点上,两种文档声明的最大区别在于blockquote, body, 和form元素仅能够包含块级元素,如:



  • 文本和图像不允许直接包含在body中,必须被p或者div等块级元素包含

  • input元素不能直接是form元素的下一层

  • blockquote元素内的文本,必须被p或者div等块级元素包含


将所有的表现都交给CSS,恪守Strict标准


在向Strict DOCTYPEs过渡的过程中,了解每个元素是做什么的比知道每个元素长啥样有效的多。


首先考虑结构和语义,然后再担心表现。

标签: , ,

固定链接-

八月 05, 2008

谷歌音乐搜索灵光闪现

今天中午,进入谷歌音乐搜索的域名(www.g.cn/music),非常惊奇地发现,这个页面已经可以访问。不过,过了几分钟后,又还魂到之前的 404界面。以下是界面截图。谷歌音乐搜索的首页,是“新歌一百强”的列表页面,左上角是谷歌常有的导航,右上角是“打开播放器”的链接,Logo使用的 是普通Logo,并未制作频道 Logo。





在谷歌音乐搜索中,谷歌提供了试听、下载、歌词和彩铃服务,其中,试听的链接地址是www.google.cn/music/top100/, 下载和歌词都是g.top100.cn,而彩铃则将用户引导至中国移动12530的页面。

在谷歌音乐搜索中,可以根据歌手、歌名和专辑名进行搜索。在顶部的搜索框下方,有三个下拉菜单进行导航,分别是歌曲排行榜:歌曲200强、新歌 100强、摇滚歌曲、影视金曲、民族歌曲;歌手排行榜:歌手100强、乐队组合、男歌手、女歌手、大陆歌手、港台歌;专辑排行榜:专辑100强、新碟 100强、摇滚专辑、影视原声大碟、中国民乐专辑、新歌100强。

搜索的效果如何?当我搜索“周杰伦”时,只有周杰伦与温岚合唱的一首《屋顶》,周杰伦与李玟合唱的《刀马旦》,以及歌手信息,其他,都是与周杰伦不怎么有关联的。这说明,谷歌尚未与周杰伦歌曲的版权公司谈判完成。在谷歌音乐搜索的帮助文档(现在也无法打开了)中,谷歌对此说明:若无法搜索到音乐,说明谷歌的合作伙伴巨鲸音乐网尚未与这家唱片公司谈判成功,“请与巨鲸公司联系”,-_-|||,让用户与巨鲸公司联系干吗?!

我猜想,谷歌公司一定很郁闷,偶尔的一次公开测试,就被人不小心看到了,而且是被我看到的,哈哈~不过估计也会是另一种心情,有人帮忙炒作了。只是苦了我,要被网友骂为“和kissbaidu”一样的献媚博客了……

×除注明外均为原创,若需转载或引用,请注明来自与G共舞本文链接及本声明.

标签: , ,

固定链接-

八月 04, 2008

Google翻译中心即将上线

Google翻译中心,类似于译言,一个提供人工翻译的地方,即将上线。我们发现,在Google的robots.txt文件里,已经加入了这个翻译中心。
这是Google对翻译中心的介绍。

标签: , ,

固定链接-

八月 02, 2008

给网站管理员的建议:创建可利用的、可抓取的网站

标签: , , , , , ,

固定链接-

七月 31, 2008

ru域名的去向

虽然之前写了这篇文章,之后有很多讨论,我也补充说明过。但是不知道怎么的慢慢地变成了RU域名2008年8月1日过期?
想到这么快期限马上要到了,今天就又去看了一下:
domain:  NET.RU
type: GENERIC
descr: Russian and non-Russian organizations involved
descr: in development of the Internet
admin-o: RIPN-ORG-RIPN
nserver: ns.ripn.net.
nserver: ns.spb.su.
nserver: ns2.ripn.net.
nserver: ns5.msk-ix.net.
nserver: ns9.ripn.net.
created: 1997.07.10
state: Delegated till 2009.11.29
changed: 2003.09.09
mnt-by: RIPN-MNT-RIPN
source: RIPN

和我之前看到的:
domain: NET.RU
type: GENERIC
descr: Russian and non-Russian organizations involved
descr: in development of the Internet
admin-o: RIPN-ORG-RIPN
nserver: ns.ripn.net.
nserver: ns.spb.su.
nserver: ns2.ripn.net.
nserver: ns5.msk-ix.net.
nserver: ns9.ripn.net.
created: 1997.07.10
state: Delegated till 2008.11.29
changed: 2003.09.09
mnt-by: RIPN-MNT-RIPN
source: RIPN
中间这一段做个对比
state: Delegated till 2008.11.29
state: Delegated till 2009.11.29
也就是Delegated till的日期往后续了一年,这么一来RIPN在即将到期时又续了一年,也就是RU将继续有效到2009年11月29日.不过目前奇怪的是paid-till: 2008.08.01指的是什么,这一项目前仍然是8月1日。
不过现在这一天还没到不能这么早下定论.

标签: , , , ,

固定链接-

七月 28, 2008

备份你的blogger

注意:1.將mybloggerbest改成你自己的. 2.如果你的文章比較多,全部打開頁面的時間會比較長 If you have a blog hosted on Blog*Spot and you've upgraded to the new version, there's an easy way to backup your blog. 如果你的博客是XXX.blogspot.com並升級到新版本,那麼就有一種簡單的辦法來备份你的blogger. This page lists the latest N posts from the blog: 這個頁面列出了你的blogger中最近的N篇文章: http://mybloggerbest.blogspot.com/search?max-results=N Instead of N, type the number of posts. If your blog has less than 1000 posts, you can save this page: 將N改為文章的個數.如果你的文章少於1000篇,你可以保存這個頁面. http://mybloggerbest.blogspot.com/search?max-results=1000 To download all the photos uploaded to your blog, DownThemAll comes to the rescue. The Firefox extension lets you download all the files with a certain extension from the current page, so it's a good way to download all the images from the previous listing. 想要下載上傳到你的blogger中所有的圖片,DownThemAll可以幫你.這個火狐插件可以讓你以一種特殊的擴展名從當前頁面下載所有的文件,所以這是一種很好的辦法從上面的列表中下載所有的圖片.

There's also a way to get all the posts in an XML feed. This is a better format if you intend to import it in a database. 當然也有一種辦法可以以XML格式下載你的blogger中的文章.如果你想存到數據庫中,這是一種更好的辦法. http://blog.pcxingxing.net.ru/feeds/posts/default?max-results=1000 The number of posts can be easily obtained from the dashboard. 你的blogger的文章數可以很容易的從控制台里看到. You can also backup the comments: 你也可以备份評論: http://blog.pcxingxing.net.ru/feeds/comments/default?max-results=1000

标签: , ,

固定链接-

七月 26, 2008

google.cn突然打不开

今天打开Google搜素,发现并没有像往常一样出现首页,而是如下的页面:
This is a test page!
Ok, the URL is: /30

This is a test page. Have a nice day!
不知道Google.cn是不是在做什么测试?发个截图做纪念

标签: , , ,

固定链接-

七月 25, 2008

Gmail悄悄增加的新功能-浏览器连接

今天偶然发现,设置里面又多了个选项:浏览器连线,可以选择是否永远只使用https,刚试了一下,发现选择后,进入Gmail都会自动切换到https了,实在很方便。
难道这个功能是对中国这种不稳定的网络
查看了帮助目前只有英文版,看起来是刚加上去的。

If you sign in to Gmail via a non-secure Internet connection, like a public wireless or non-encrypted network, your Google account may be more vulnerable to hijacking. Non-secure networks make it easier for someone to impersonate you and gain full access to your Google account, including any sensitive data it may contain like bank statements or online log-in credentials. We recommend selecting the 'Always use https' option in Gmail any time your network may be non-secure. HTTPS, or Hypertext Transfer Protocol Secure, is a secure protocol that provides authenticated and encrypted communication.

To enable this feature in Gmail:

  1. Sign in to Gmail.
  2. Click Settings at the top of any Gmail page.
  3. Set 'Browser Connection' to 'Always use https.'
  4. Click Save Changes.
  5. Reload Gmail.

Please note that selecting 'Always use https' will prevent you from accessing Gmail via HTTP (Hypertext Transfer Protocol). In addition, it may make Gmail a bit slower. If you trust the security of your network, you can turn this feature off at any time.

If you use a public computer to check your email, it's also important to end each of your Gmail sessions by clicking Sign out at the top of any Gmail page and to close all Gmail browser windows.


标签: , , ,

固定链接-

七月 16, 2008

原来申请RIPN是这么容易

今天又申请了一个ripn,没想到今天申请的竟然没有审核,是申请后即时开通的。申请几分钟后收到邮件,说明已经申请成功了。这个RIPN在之前申请还是非常困难的,我只有在去年申请成功过。不知道这次RIPN是怎么了。

标签: , ,

固定链接-

七月 03, 2008

将 AdSense 账户更新为 Google 账户

今天在登录Google AdSense时突然来一个更新Google账户的页面,开始不知道怎么回事,后来查了一下。 5月22日,AdSense官方博客发表文章将 AdSense 账户更新为 Google 账户,其实以前申请的adsense都是用的adsense账户(包括我的),现在Google要求把adsense账户更新为Google账户。
星期四, 五月 22, 2008 作者 Arlene Lee - AdSense 支持小组 您可能还记得,我们从去年五月就开始请发布商把 AdSense 账户更新为 Google 账户。更新后您就可以使用一个用户名和密码管理多个 Google 产品。 在接下来的几周,我们会要求所有发布商把 AdSense 账户更新为 Google 账户,如果您还没有更新,为了避免账户登录出现问题,我们建议您尽快更新。您只需登录账户,账户中会自动显示更新指南,按照指南操作即可。如果您的账户中没有显示更新指南,就表明您的账户已经成功更新为 Google 账户了。 我们收到一些发布商的反馈表示对更新为 Google 账户有些顾虑,我们就在这里为大家解答一下: 1.我并不想统一管理 AdSense 和 Google 其他产品,我希望分开管理。 您可以分开管理。因为您可以拥有多个 Google 账户,您可以把 AdSense 账户更新为与其他产品不同的 Google 账户。比如您的Gmail 和网站管理员工具的账户是fabushang@gmail.com,您可以在更新 AdSense 账户时创建另一个新的 Google 账户如publisher@yoursite.com,专门用来管理 AdSense 账户。如果您是这种情况,我们建议您更新时先选择“我已经有用于 Gmail,Orkut 或iGoogle 主页等 Google 服务的电子邮件地址和密码(Google 账户)”,然后选择“我希望专为 AdSense 选择一个新的登录名和密码” 2.这个更新安全吗?我的 AdWords有我的信用卡信息,会不会泄漏? 请放心,我们非常重视 AdSense 账户的安全问题,您的 AdSense 账户信息不会和其他产品共享,从AdSense 界面无法访问您的 AdWords 信用卡信息。如果您仍然不放心,您可以按照上面的方法设置两个单独的 Google 账户。 3.我之前试过更新,但是出错了:“您选择的 Google 账户已经与另一个用户相连。” 我该怎么办? 这表明您选择的电子邮件地址之前曾经用来申请过 AdSense 账户(这个账户可能是已经批准的账户,也可能是没有批准的账户)。我们也发现了很多发布商更新时使用一个之前申请 AdSense 没有通过的电子邮件地址,所以我们对更新系统和指南进行了改进,现在如果您想使用一个之前申请没有通过的电子邮件地址,就不会出现出错信息了。 4.如果我不更新会怎么样呢? 如果您在要求时间内没有更新,您就不能再登录 AdSense 账户。所以我们建议您尽快更新。 最后,我们建议您到我们的帮助中心看一下更多关于更新账户的帮助信息。

标签: , ,

固定链接- 相关链接

五月 01, 2008

FriendFeed

 FriendFeed是一个把常用Web 2.0服务上的相关信息聚合到一个Feed上的聚合服务,目前已经开放注册,访问FriendFeed后,点首页右边的Sign in or Create an account即可注册帐号。

标签: ,

固定链接- 相关链接

二月 17, 2008

更新到Gregarius 0.5.5

开源 RSS 聚合工具 Gregarius 一直在持续的改进. 最新的 0.5.5 版本相对于以前的老版本有了许多新功能.
本站也使用了该聚合工具,使用了几个月发现有很多bug,最明显的就是RSS更新的时候遇到无法显示网页。 现在更新了一下0.5.5这个问题没了。
下载:
gregarius.net/nightlies/

标签: ,

固定链接- 相关链接

二月 02, 2008

google错误

今天在用Google搜索的时候发生了错误:

Google
错误

很抱歉..
... 此刻我们无法回应您的要求。该请求通过电脑病毒或间谍软件向我们自动发送,而且看来您的电脑或网络已受感染。
我们会尽快恢复您的使用,请稍后再试。同时,您可以运行病毒检测器间谍软件清除器确保您的电脑没有携带病毒及其它欺诈软件。
我们对此深感抱歉,希望很快在Google 与您再会。

如要继续,请输入下列字符:

标签: ,

固定链接- 相关链接

二月 01, 2008

隐藏 robots.txt

robots.txt 会暴露目录结构的问题,今天找到了答案。用 urlrewrite

RewriteCond %{HTTP_USER_AGENT} ^(Mozilla|Opera)
RewriteCond
%{HTTP_USER_AGENT}!(Slurp|surfsafely)
RewriteRule ^robots\.txt$ /someotherfile [L]

或者干脆 urlrewrite 到 cgi 或者 php 文件。
如果不想 urlrewrite 的话还可以设置txt伺服类行为应用程序,application/x-httpd-php .txt,对 .txt 当成 php 处理。注意:这时候站点内的其它 .txt的第一句都要有

详细说明在 Advantages of a smart robots.txt file

标签: , ,

固定链接-

一月 28, 2008

50th anniversary of the Lego brick

今天的Google换了以下的LOGO
50th anniversary of the Lego brick
标题是50th anniversary of the Lego brick,搜索一下
不知道the Lego brick是什么东西.
Updated :原来是庆祝乐高积木50周年。

标签: ,

固定链接- 相关链接