案例: 本次实践的目的是抓取百度空间的博客列表信息.
代码:
require 'nokogiri'
require 'open-uri'
require 'iconv'
# define the html url
url="http://hi.baidu.com/kenrome/blog"
# get the nokogiri document
doc = Nokogiri::HTML(open(url))
# new a file for save
file = File.new("c:/a.html","w")
#get the blog list and save to file
doc.css("#m_blog .tit").each do |line|
file.write(line)
end
结果:
在Heroku上安装gem实践
Ruby解析HTML插件Nokogiri使用实践
Rails中通过Gmail发送邮件配置总结
jQuery Validation
通过Active_Merchant集成支付宝
InvalidAuthenticityToken错误的解决办法
inruby网站数据访问统计表
Rails中通过Gmail发送邮件
I18n demo 学习总结
Net::HTTP, REXML, API
Rails获取客户端IP地址
I18n--让你的程序支持国际化
使用Ruby1.9,Rails,MySQL能够在UTF-8下共存
Ruby1.9的兼容性问题
Heroku常用命令
分享到:
相关推荐
Crystal的一个Html解析器(类似于Ruby的Nokogiri)
使用ruby解析awdb离线库使用ruby解析awdb离线库使用ruby解析awdb离线库使用ruby解析awdb离线库使用ruby解析awdb离线库使用ruby解析awdb离线库使用ruby解析awdb离线库使用ruby解析awdb离线库使用ruby解析awdb离线库...
主要介绍了Ruby中使用Nokogiri包来操作XML格式数据的教程,Nokogiri是一个gem包,Nokogiri可以依靠XPath和CSS3选择器方式来实现搜索功能,比较强大,需要的朋友可以参考下
ruby对xml文件的解析,不是很全,应该还是有一定帮助的
innodb_ruby, 在 ruby 中,一个解析器格式的解析器, 文件格式的解析器,在 ruby 中这个库和工具的目的是暴露一些隐藏的InnoDB内部。 这里代码不用于关键的生产使用。 它很有可能是危险的而且可能是危险的。 它的...
这个Ruby宝石向Nokogiri XML节点添加了to_hash和to_json方法,从而使我们可以将任意XML节点序列化为JSON。 该gem还可以获取属性,注释,处理说明和doctype声明。 结果是罗word的,但完整的。 另外,在可能的情况...
html_doc = Nokogiri::HTML(<html><body><h1>Mr. Belvedere Fan Club</h1></body></html>) xml_doc = Nokogiri::XML(<root><aliens><alien><name>Alf</name></alien></aliens></root>) ...
qtbindings - 允许你在Ruby中使用QT Gui工具包
ruby使用REXML解析处理xml.pdf
GlobalPhone - 在Ruby中使用Google的libphonenumber数据库解析、验证和格式的电话号码
ruby-macho, 解析Mach文件的纯 ruby 库 ruby 用于检查和修改mach文件的ruby 库。什么是mach文件?文件格式由 OS X 和 iOS ( 它的他人) 用于目标文件。可执行文件。动态库等的通用二进制格式。文档完整的文档可以在 ...
PSD.rb - 在Ruby中轻松解析Photoshop文件
主要介绍了Ruby和Ruby on Rails中解析JSON格式数据的实例教程,文中介绍到的Ruby on Rails中的JSON解析工具包json_pure使用起来十分方便,需要的朋友可以参考下
Text Processing with Ruby ruby文档解析 完整版 完整版
QR-code - 一个用于解析QR码的Ruby库
publicsuffix-ruby, 在 public 后缀列表中,基于 ruby的域名解析器 用于 ruby的public 后缀PublicSuffix是一个基于 public 后缀列表的ruby 域 NAME 解析器。 要求ruby> = 2.1对于较老版本的ruby,使用以前的版本。...