require 'nokogiri'

html = "<html><body><h1>سلام دنیا!</h1></body></html>"
doc = Nokogiri::HTML(html)
puts doc.at_css("h1").text