爬虫jsoup解析工具之解析标题

发布于:2024-04-16 ⋅ 阅读:(144) ⋅ 点赞:(0)
package day01;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.junit.Test;
import java.net.URL;
public class JsoupFirstTest {

    @Test
    public void main() throws Exception {
        /*
        * <!--jsoup解析工具所需依赖-->
        <dependency>
            <groupId>org.jsoup</groupId>
            <artifactId>jsoup</artifactId>
            <version>1.10.3</version>
        </dependency>

        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>4.12</version>
            <scope>test</scope>
        </dependency>

        <dependency>
            <groupId>commons-io</groupId>
            <artifactId>commons-io</artifactId>
            <version>2.6</version>
        </dependency>

        <dependency>
            <groupId>org.apache.commons</groupId>
            <artifactId>commons-lang3</artifactId>
            <version>3.7</version>
        </dependency>
        * 
        * */
        
        //解析ur1地址,第一个参数是访问的ur1,第二个参数是访问时候的超时时间
        Document parse = Jsoup.parse(new URL("https://k.sina.com.cn/article_1887344341_707e96d502001gfx8.html?from=news&subch=onews"), 1000);

        //使用标签选择器,获取title标签中的内容
        /*
        * first获取1个
        * text转换为字符串
          反之亦然不加这两个可以解析多个
        * */
        String text = parse.getElementsByTag("title").first().text();

        System.out.println(text);

    }

}

网站公告

今日签到

点亮在社区的每一天
去签到