第三章 Python数据爬取¶

字符串函数¶

In [1]:
str = '''
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_0">
    <a href="../info/1049/41314.htm" class="c-img-item" target="_blank" title="蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军">
        <div class="c-img-16_9">
            <img src="/__local/D/52/5E/42A0D74CFFAEC15104B8339ED10_28D38704_D4534.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军
            </span>
            <span class="c-img-form">
                2023-10-07
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_0" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_1">
    <a href="../info/1049/41184.htm" class="c-img-item" target="_blank" title="融通中外·商海鸿鹄新征程  博闻古今·上下求索向未来">
        <div class="c-img-16_9">
            <img src="/__local/6/63/36/B2259C76A0BFEAEC972FA226CA2_5787963B_61C3F.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                融通中外·商海鸿鹄新征程  博闻古今·上下求索向未来
            </span>
            <span class="c-img-form">
                2023-09-20
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_1" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_2">
    <a href="../info/1049/40994.htm" class="c-img-item" target="_blank" title="国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计专硕党支部开展共建活动">
        <div class="c-img-16_9">
            <img src="/__local/7/7F/8B/3454FC8ACD3E00F86D231177116_C44D35AA_9758.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计...
            </span>
            <span class="c-img-form">
                2023-09-20
            </span>
        </div>
    </a>
</div>
'''

while 'title=\"' in str:
    title_beg = str.index('title=\"')+len('title=\"')
    title_end = str.index('">', title_beg)
    print(str[title_beg:title_end])
    str = str[title_end:]
蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军
融通中外·商海鸿鹄新征程  博闻古今·上下求索向未来
国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计专硕党支部开展共建活动

正则表达式¶

In [2]:
import re #导入正则匹配库

str = '''
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_0">
    <a href="../info/1049/41314.htm" class="c-img-item" target="_blank" title="蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军">
        <div class="c-img-16_9">
            <img src="/__local/D/52/5E/42A0D74CFFAEC15104B8339ED10_28D38704_D4534.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军
            </span>
            <span class="c-img-form">
                2023-10-07
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_0" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_1">
    <a href="../info/1049/41184.htm" class="c-img-item" target="_blank" title="融通中外·商海鸿鹄新征程  博闻古今·上下求索向未来">
        <div class="c-img-16_9">
            <img src="/__local/6/63/36/B2259C76A0BFEAEC972FA226CA2_5787963B_61C3F.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                融通中外·商海鸿鹄新征程  博闻古今·上下求索向未来
            </span>
            <span class="c-img-form">
                2023-09-20
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_1" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_2">
    <a href="../info/1049/40994.htm" class="c-img-item" target="_blank" title="国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计专硕党支部开展共建活动">
        <div class="c-img-16_9">
            <img src="/__local/7/7F/8B/3454FC8ACD3E00F86D231177116_C44D35AA_9758.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计...
            </span>
            <span class="c-img-form">
                2023-09-20
            </span>
        </div>
    </a>
</div>
'''

p1 = re.compile('title="(.+)">')
result1 = re.findall(p1, str)
print(result1)
p2 = re.compile('<span class="c-img-form">.+?([\d\-]+).+?</span>', re.S)
result2 = re.findall(p2, str)
print(result2)
for i in range(len(result1)):
    print('{0}\t{1}'.format(result2[i],result1[i]))
['蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军', '融通中外·商海鸿鹄新征程  博闻古今·上下求索向未来', '国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计专硕党支部开展共建活动']
['2023-10-07', '2023-09-20', '2023-09-20']
2023-10-07	蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军
2023-09-20	融通中外·商海鸿鹄新征程  博闻古今·上下求索向未来
2023-09-20	国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计专硕党支部开展共建活动
In [3]:
import re

#贪婪匹配和非贪婪匹配
#找出字符串中介于‘成绩为’和‘分’之间的内容
str = '在这次期末考试中,小明的成绩为90分,成绩为全班最高分,丽丽的成绩为89分,小军的成绩为75分,小刘的成绩为75分。'
print(re.findall('成绩为(\d+)分.+成绩为(\d+)分',str))
print(re.findall('成绩为(\d+)分.+?成绩为(\d+)分',str))
print(re.findall('成绩为(\d+)分',str))
[('90', '75')]
[('90', '89'), ('75', '75')]
['90', '89', '75', '75']
In [4]:
import re

#贪婪匹配和非贪婪匹配
#找出字符串中介于‘成绩为’和‘分’之间的内容
str = '小明的成绩为90分,丽丽的成绩为89分'
p1 = re.compile('成绩为(\d+)分')#贪婪匹配,*匹配的字符越多越好
print(p1.findall(str))
p2 = re.compile('成绩为(\d+?)分')#加上问号,表示非贪婪匹配,*匹配的字符越少越好(次数则不限)
print(p2.findall(str))
print(p2.search(str))#search()返回第一次成功匹配的位置
print(p2.search(str).span())#再用span()提取具体位置,span返回一个tuple
print(p2.match(str))#match() 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none
print(re.match('小明',str))#match()的另外一种使用形式
['90', '89']
['90', '89']
<re.Match object; span=(3, 9), match='成绩为90分'>
(3, 9)
None
<re.Match object; span=(0, 2), match='小明'>
In [1]:
import re

#逻辑或
#找出金陵十二钗中所有姓贾、史、王、薛的人物
str = '''
林黛玉,香菱,晴雯
薛宝钗,薛宝琴,袭人
贾元春,尤三姐,小红
贾探春,尤二姐,鸳鸯
史湘云,邢岫烟,紫鹃
妙玉,李纹,金钏
贾迎春,李绮,莺儿
贾惜春,宝蟾,司棋
王熙凤,宝珠,玉钏
贾巧姐,瑞珠,茜雪
李纨,平儿,麝月
秦可卿,娇杏,柳五儿
'''
p1 = re.compile('(贾.{1,2}|史.{1,2}|王.{1,2}|薛.{1,2})')#匹配陈或者李开头、后面跟着1-2个任意字符的字符串,注意:换行符除外
print(p1.findall(str))
print(re.findall('([贾史王薛].{1,2})', str))
['薛宝钗', '薛宝琴', '贾元春', '贾探春', '史湘云', '贾迎春', '贾惜春', '王熙凤', '贾巧姐']
['薛宝钗', '薛宝琴', '贾元春', '贾探春', '史湘云', '贾迎春', '贾惜春', '王熙凤', '贾巧姐']
基本的urllib进行数据爬取¶
In [ ]:
import urllib.request

# 目前已经失效
page_url = 'https://sm.xmu.edu.cn/xueyuanxx/xyxw.htm'
page_content = urllib.request.urlopen(page_url).read()
print(page_content)

上面的代码运行完后会发现输出了一系列英文数字字符、没有中文,这是因为没有经过编码的转换

In [7]:
page_content = urllib.request.urlopen(page_url).read().decode('utf-8')#decode('utf-8')将得到的内容转换为utf-8编码
print(page_content)
<!DOCTYPE html>
<html lang="zh">
    <head>
        <meta charset="UTF-8">
        <meta name="viewport" content="width=device-width, initial-scale=1.0">
        <meta http-equiv="X-UA-Compatible" content="ie=edge">
        <link rel="stylesheet" type="text/css" href="../resources/layui/css/layui_2022.css" />
        <link rel="stylesheet" type="text/css" href="../resources/css/swiper-bundle.min_2022.css" />
        <link rel="stylesheet" type="text/css" href="../resources/css/style_2022.css" />
        <link rel="stylesheet" type="text/css" href="../resources/css/media.css" />
        <script src="../resources/layui/layui_2022.js" type="text/javascript" charset="utf-8"></script>
        <script src="../resources/js/swiper-bundle.min_2022.js" type="text/javascript" charset="utf-8"></script>
        <script src="../resources/js/jquery-1.11.3.min_2022.js" type="text/javascript" charset="utf-8"></script>
        <script src="../resources/js/common_2022.js" type="text/javascript" charset="utf-8"></script>
        <title>学院新闻-厦门大学管理学院-SCHOOL OF MANAGEMENT,XIAMEN UNIVERSITY</title><meta name="pageType" content="2">
<meta name="pageTitle" content="学院新闻">
<META Name="keywords" Content="MBA,EMBA,EDP,MPAcc,ME,MTA,ICE,高层培训,总裁办,企业培训,中国MBA,工商管理,管理学院,商学院,China MBA,XiaMen MBA,MPAcc,金融,会计,硕士,管理,经济,管理学院,厦大,厦门管院,厦门大学,厦门大学管理学院,学院新闻" />

    <!--Announced by Visual SiteBuilder 9-->
<link rel="stylesheet" type="text/css" href="../_sitegray/_sitegray_d.css" />
<script language="javascript" src="../_sitegray/_sitegray.js"></script>
<!-- CustomerNO:77656262657232307778475d50515742000100034e5c -->
<link rel="stylesheet" type="text/css" href="../2022_newslist.vsb.css" />
<script type="text/javascript" src="/system/resource/js/vsbscreen.min.js" id="_vsbscreen" devices="pc|pad"></script>
<script type="text/javascript" src="/system/resource/js/counter.js"></script>
<script type="text/javascript">_jsq_(1049,'/2022_newslist.jsp',-1,1473072843)</script>
</head>
    <body class="c-s-bg">
        <div class="layui-fluid">
            <div class="c-header">
                <div class="layui-container c-dis-flex">
                    <div class="c-logo">
                        
<!-- 网站logo图片地址请在本组件"内容配置-网站logo"处填写 -->
<a href="../index.htm" title="管理学院"><img src="../resources/css/images/logo.png"></img></a>
                    </div>
                    <div class="c-menu"><ul>
<li><a href="../xygk/xyjj.htm">学院概况</a>
        <div class="nav-child">
                <a href="../xygk/xyjj.htm"><span>学院简介</span></a>
                <a href="../xygk/xyls.htm"><span>学院历史</span></a>
                <a href="../xygk/yjysm.htm"><span>愿景与使命</span></a>
                <a href="../xygk/xyld.htm"><span>学院领导</span></a>
                <a href="../xygk/xszx.htm"><span>系所中心</span></a>
                <a href="../xygk/znbm.htm"><span>职能部门</span></a>
                <a href="../xygk/bszn.htm"><span>办事指南</span></a>
                <a href="../xygk/lxwm.htm"><span>联系我们</span></a>
        </div>
</li>
<li><a href="djsz.htm">党建思政</a>
        <div class="nav-child">
                <a href="djsz/chuxin.htm"><span>初心·使命</span></a>
                <a href="djsz/dsxx.htm"><span>党史学习</span></a>
                <a href="djsz/ztjyzl.htm"><span>主题教育专栏</span></a>
        </div>
</li>
<li><a href="https://smr.xmu.edu.cn/TeacherWeb/Teacher_Special_2022.aspx">师资队伍</a>
        <div class="nav-child">
                <a href="https://smr.xmu.edu.cn/TeacherWeb/Teacher_Special_2022.aspx"><span>师资队伍</span></a>
                <a href="../szdw/gjfwxz.htm"><span>国际访问学者</span></a>
        </div>
</li>
<li><a href="../kxyj/kydt.htm">科学研究</a>
        <div class="nav-child">
                <a href="../kxyj/kydt.htm"><span>科研动态</span></a>
                <a href="../kxyj/xshd.htm"><span>学术活动</span></a>
                <a href="../kxyj/yjzx.htm"><span>研究中心</span></a>
                <a href="https://smr.xmu.edu.cn"><span>师资科研管理系统</span></a>
        </div>
</li>
<li><a href="../gjjl/gjhgk/gjhgk.htm">国际交流</a>
        <div class="nav-child">
                <a href="../gjjl/gjhgk.htm"><span>国际化概况</span></a>
                <a href="../gjjl/gjrz.htm"><span>国际认证</span></a>
                <a href="../gjjl/gjhdt.htm"><span>国际化动态</span></a>
                <a href="../gjjl/xsjlxm.htm"><span>学生交流项目</span></a>
                <a href="../gjjl/lhpy.htm"><span>联合培养</span></a>
                <a href="../gjjl/gjxs.htm"><span>国际学生</span></a>
                <a href="../gjjl/cg_j_zn.htm"><span>出国(境)指南</span></a>
                <a href="../gjjl/lxwsb.htm"><span>联系外事办</span></a>
        </div>
</li>
<li><a href="http://smcareer.xmu.edu.cn/">职业发展</a>
</li>
<li><a href="http://sm-alumni.xmu.edu.cn/">校友联系</a>
</li>
</ul></div>
                    <div class="c-header-right">
                        <a href="javascript:;" class="navbar-toggler">
                            <i class="iconfont icon-liebiao"></i>
                        </a>
                        <a href="javascript:;" id="btn-search">
                            <i class="iconfont icon-sousuo"></i>
                        </a>
                        <a href="https://sm.xmu.edu.cn/en">
                            EN
                        </a>
                    </div>
                    


<script language="javascript" src="/system/resource/js/base64.js"></script><script language="javascript" src="/system/resource/js/jquery/jquery-latest.min.js"></script><script language="javascript" src="/system/resource/vue/vue.js"></script><script language="javascript" src="/system/resource/vue/bluebird.min.js"></script><script language="javascript" src="/system/resource/vue/axios.js"></script><script language="javascript" src="/system/resource/vue/polyfill.js"></script><script language="javascript" src="/system/resource/vue/token.js"></script><LINK href="/system/resource/vue/static/element/index.css" type="text/css" rel="stylesheet"><script language="javascript" src="/system/resource/vue/static/element/index.js"></script><script language="javascript" src="/system/resource/vue/static/public.js"></script><style>
    #appu2 .qwss{
        height: 31px;
        font-size: 12px;
        min-width: 190px;
        max-width: 600px;
        width: 60%;
        margin-top: -15px;
        outline: none;
        padding-left: 10px;
        border-radius: 2px;
        border: 1px solid #e4e7ed;}
    #appu2 .tj{
        padding-left: 6px;
        letter-spacing: 5px;
        color: white;
        min-width: 53px;
        max-width: 150px;
        height: 32px;
        border: 0;
        border-radius: 2px;
        background-color: #1890FF;
        position: relative;
        top: 1px;
        width: 20%;
        margin-top: -15px;}
</style>
<div id="divu2"></div>
<script type="text/html" id="htmlu2">
    <div id="appu2" class="search-box">
        <div v-if="!isError" class="search">
            <input type="text" placeholder="请输入关键字..." autocomplete=off v-model=query.keyWord @keyup.enter="onSubmit">
            
        </div>
        <a href="javascript:;" v-on:click="onSubmit()"></a>
        <a href="javascript:;" id="btn-search-close"><i class="iconfont icon-guanbi_o"></i></a>
        
        <div v-if="isError" style="color: #b30216; font-size:18px;text-align: center;padding:20px;">
            应用维护中!
        </div>
    </div>
</script>
<script>
    $("#divu2").html($("#htmlu2").text());
</script>
<script>
    var appOwner = "1473072843";
    var token = gettoken(10);
    var urlPrefix = "/aop_component/";

    jQuery.support.cors = true;
    $.ajaxSetup({
        beforeSend: function (request, settings) {
            request.setRequestHeader("Authorization", token);
            request.setRequestHeader("owner", appOwner);
        }
    });

    new Vue({
        el: "#appu2",
        data: function () {
            return {
                query: {
                    keyWord: "",//搜索关键词
                    owner: appOwner,
                    token: token,
                    urlPrefix: urlPrefix,
                    lang:"i18n_zh_CN"
                },
                isError: false
            }
        },
        mounted: function () {
            var _this = this;
            // _this.init();
        },
        methods: {
            init: function(){
                $.ajax({
                    url: "/aop_component//webber/search/test",
                    type: "get",
                    success: function (response) {
                        if (response.code == "0000") {
                        } else if (response.code == "220") {
                            _this.isError = true;
                            console.log(response);
                        } else if (!response.code) {
                            _this.isError = true;
                            console.log(response);
                        }
                    },
                    error: function (response) {
                        _this.isError = true;
                    }
                });
            },
            onSubmit: function (e) {
                var url = "/views/search/modules/resultpc/soso.html";
                if ("10" == "1" || "10" == "2") {
                    url = "https://cmsapp.xmu.edu.cn/" + url;
                }
                var _this = this;
                var query = _this.query;
                if (url.indexOf("?") > -1) {
                    url = url.split("?")[0];
                }
                if (query.keyWord) {
                    var query = new Base64().encode(JSON.stringify(query));
                    window.open(url + "?query=" + query);
                } else {
                    alert("请填写搜索内容")
                }
            },
        }
    })
</script>
                </div>
            </div>
            </div>
            <!-- 内页banner -->
            <div class="layui-fluid c-s-banner">
                <img src="../resources/css/images/c-bg-img2.png" />
            </div>
            <!-- 内页banner end -->
            <!-- 内容块 -->
            <div class="c-ny-fluid">
                <div class="c-ny-body">
                    
                        
                        <div class="sideBar">
                            <div class="sideBar-head">



学院信息</div>
                            <div class="sideBar-body">
<ul class="side_nav">
<input id="M_id" type="hidden" value="nav_12">
<input id="PM_id" type="hidden" value="nav_172">
<li id="nav_" class=" active"><a href="xyxw.htm"><span>学院新闻</span></a>
</li>                                  
<li id="nav_"><a href="zsxx.htm"><span>招生信息</span></a>
</li>                                  
<li id="nav_"><a href="jwxx.htm"><span>教务信息</span></a>
</li>                                  
<li id="nav_"><a href="jwjl.htm"><span>境外交流</span></a>
</li>                                  
<li id="nav_"><a href="djsz.htm"><span>党建思政</span><span class="iconfont icon-right"></span></a>
        <div class="side-child">
            
                <a href="djsz/chuxin.htm" id="nav_"><span>初心·使命</span></a>
                <a href="djsz/dsxx.htm" id="nav_"><span>党史学习</span></a>
                <a href="djsz/ztjyzl.htm" id="nav_"><span>主题教育专栏</span></a>
           
        </div>
</li>                                  
<li id="nav_"><a href="rsxx.htm"><span>人事信息</span></a>
</li>                                  
<li id="nav_"><a href="gzzd.htm"><span>规章制度</span></a>
</li>                                  
<li id="nav_"><a href="xyyx.htm"><span>学院影像</span></a>
</li>                                  
<li id="nav_"><a href="wjxz.htm"><span>文件下载</span></a>
</li>                                  
</ul>
</div>

<script type="text/javascript">
                            $(function(){
                                
                                setCurrent();
                                
                            })
                            function setCurrent(){
                                var li_menuid = "li#" +$("#M_id").val();
                                var a_menuid = "a#" +$("#M_id").val();
                            
                                var li_parMenuid = "li#" + $("#PM_id").val();
                                var a_parMenuid = "a#" + $("#PM_id").val();
                            
                                //当前菜单没有子菜单
                                if (!jQuery.isEmptyObject($(li_menuid))&&$(li_menuid).length > 0){
                                    $(li_menuid).addClass("active");
                                }
                            
                                //当前菜单有子菜单
                                if (!jQuery.isEmptyObject($(li_parMenuid))&&$(li_parMenuid).length > 0){
                                    $(li_parMenuid).addClass("active");
                                    $(a_menuid).css("color","#B50729");
                                }
                            
                                if (!jQuery.isEmptyObject($(a_parMenuid))&&$(a_parMenuid).length > 0){
                                    $(a_parMenuid).css("color","#B50729");
                                    $(a_parMenuid).closest("li").addClass("active");
                                }
                            }
                    
                        </script>
                        <style>
                        .side-child a.on{color:#013d87;}
                        .side-child p.on{display:block;}
                        
                        </style>
                        </div>
                        <div class="c-ny-main">
                            <div class="c-page-head c-dis-flex">
                                <div class="c-page-title">
                                    <span class="c-line">



学院新闻</span>
                                </div>
                                <div class="c-page-breadcrumb"><div class="c-page-breadcrumb">
        <a href="../index.htm">首页</a>&nbsp;/&nbsp;
        <a href="../xueyuanxx.htm">学院信息</a>&nbsp;/&nbsp;
        <a href="xyxw.htm">学院新闻</a>&nbsp;/&nbsp;
</div></div>
                            </div>
                            <div class="aaa">
                                <script language="javascript" src="/system/resource/js/centerCutImg.js"></script><script language="javascript" src="/system/resource/js/dynclicks.js"></script><script language="javascript" src="/system/resource/js/ajax.js"></script><div class="layui-row layui-col-space80 c-list-grid c-padding-top80">
       
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_0">
    <a href="../info/1049/41394.htm" class="c-img-item" target="_blank" title="厦门大学第三届“静木芳林”创业大赛圆满结束">
        <div class="c-img-16_9">
            <img src="/__local/6/1E/82/25C88D0B68B087BF708CA86106C_199676F7_29F524.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                厦门大学第三届“静木芳林”创业大赛圆满结束
            </span>
            <span class="c-img-form">
                2023-10-16
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_0" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_1">
    <a href="../info/1049/41314.htm" class="c-img-item" target="_blank" title="蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军">
        <div class="c-img-16_9">
            <img src="/__local/D/52/5E/42A0D74CFFAEC15104B8339ED10_28D38704_D4534.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军
            </span>
            <span class="c-img-form">
                2023-10-07
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_1" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_2">
    <a href="../info/1049/41184.htm" class="c-img-item" target="_blank" title="融通中外·商海鸿鹄新征程  博闻古今·上下求索向未来">
        <div class="c-img-16_9">
            <img src="/__local/6/63/36/B2259C76A0BFEAEC972FA226CA2_5787963B_61C3F.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                融通中外·商海鸿鹄新征程  博闻古今·上下求索向未来
            </span>
            <span class="c-img-form">
                2023-09-20
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_2" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_3">
    <a href="../info/1049/40994.htm" class="c-img-item" target="_blank" title="国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计专硕党支部开展共建活动">
        <div class="c-img-16_9">
            <img src="/__local/7/7F/8B/3454FC8ACD3E00F86D231177116_C44D35AA_9758.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计...
            </span>
            <span class="c-img-form">
                2023-09-20
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_3" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_4">
    <a href="https://mp.weixin.qq.com/s/yzf-K5MMqmF-YJVb3N6B4w" class="c-img-item" target="_blank" title="喜讯 | 管理学院4篇案例在第十四届“全国百篇优秀管理案例”评选中获奖">
        <div class="c-img-16_9">
            <img src="/__local/C/E3/A5/0159B9EBF854B2A37EE1E77C668_437CE20D_A51C.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                喜讯 | 管理学院4篇案例在第十四届“全国百篇优秀管理案例”评选中获奖
            </span>
            <span class="c-img-form">
                2023-09-13
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_4" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_5">
    <a href="../info/1049/40784.htm" class="c-img-item" target="_blank" title="管理学院屈文洲教授获评厦门大学2023年“我最喜爱的十位老师”">
        <div class="c-img-16_9">
            <img src="/__local/B/DE/0C/E7717199B0703CD7C1F8EA26B21_B9647A8F_4BB08.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                管理学院屈文洲教授获评厦门大学2023年“我最喜爱的十位老师”
            </span>
            <span class="c-img-form">
                2023-09-11
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_5" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_6">
    <a href="../info/1049/40804.htm" class="c-img-item" target="_blank" title="入学教育|管理学院、财务管理与会计研究院开展研究生新生入学教育系列讲座">
        <div class="c-img-16_9">
            <img src="/__local/5/F0/4A/B12E815FC40064CA8221F8ED8BE_33B717AA_BD22C.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                入学教育|管理学院、财务管理与会计研究院开展研究生新生入学教育系列讲座
            </span>
            <span class="c-img-form">
                2023-09-11
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_6" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_7">
    <a href="../info/1049/40794.htm" class="c-img-item" target="_blank" title="入学教育|管理学院举办2023级本科新生见面会">
        <div class="c-img-16_9">
            <img src="/__local/4/3B/1D/262369D70EFB5DAE2B32A11AC5E_6E90F028_345484.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                入学教育|管理学院举办2023级本科新生见面会
            </span>
            <span class="c-img-form">
                2023-09-11
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_7" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_8">
    <a href="../info/1049/40744.htm" class="c-img-item" target="_blank" title="管理学院举行2023年新教职工座谈会">
        <div class="c-img-16_9">
            <img src="/__local/B/3A/90/124F0205380529FE7358BF802B0_73A17B95_61030.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                管理学院举行2023年新教职工座谈会
            </span>
            <span class="c-img-form">
                2023-09-10
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_8" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_9">
    <a href="../info/1049/40714.htm" class="c-img-item" target="_blank" title="管理学院、财务管理与会计研究院2023级新生开学典礼暨院长第一课圆满举行">
        <div class="c-img-16_9">
            <img src="/__local/3/62/0B/2CB313AB9B6DB42CC03A22F1192_20B43439_29A0D.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                管理学院、财务管理与会计研究院2023级新生开学典礼暨院长第一课圆满举行
            </span>
            <span class="c-img-form">
                2023-09-09
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_9" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_10">
    <a href="../info/1049/40694.htm" class="c-img-item" target="_blank" title="管理学院传达学习厦门大学第十二次党代会精神">
        <div class="c-img-16_9">
            <img src="/__local/C/62/D9/FA84496B76078A28093BD0B3189_84A51490_4B117.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                管理学院传达学习厦门大学第十二次党代会精神
            </span>
            <span class="c-img-form">
                2023-09-08
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_10" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_11">
    <a href="https://mp.weixin.qq.com/s/-T5cRmO7t87lIiSk_g8dog" class="c-img-item" target="_blank" title="厦门大学2023级MBA新生开学典礼顺利举行">
        <div class="c-img-16_9">
            <img src="/__local/A/94/81/E421B8648A68387F73E9D469407_7A78069A_3D6B84.jpg">
        </div>
        <div class="c-img-content">
            <span class="c-img-item-title c-line-clamp">
                厦门大学2023级MBA新生开学典礼顺利举行
            </span>
            <span class="c-img-form">
                2023-09-06
            </span>
        </div>
    </a>
</div>
                                        
    <span id="section_u8_11" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"></span>
</div>

<div class="page">
        <!-- 分页 -->
        <link rel="stylesheet" Content-type="text/css" href="/system/resource/css/pagedown/sys.css"><div class="pb_sys_common pb_sys_normal2 pb_sys_style6" style="margin-top:10px;text-align:center;"><span class="p_pages"><span class="p_first_d p_fun_d">首页</span><span class="p_prev_d p_fun_d">上页</span><span class="p_no_d">1</span><span class="p_no"><a href="xyxw/112.htm">2</a></span><span class="p_no"><a href="xyxw/111.htm">3</a></span><span class="p_no"><a href="xyxw/110.htm">4</a></span><span class="p_no"><a href="xyxw/109.htm">5</a></span><span class="p_dot">...</span><span class="p_no"><a href="xyxw/1.htm">113</a></span><span class="p_next p_fun"><a href="xyxw/112.htm">下页</a></span><span class="p_last p_fun"><a href="xyxw/1.htm">尾页</a></span></span></div>

</div><script>_showDynClickBatch(['dynclicks_u8_41394','dynclicks_u8_41314','dynclicks_u8_41184','dynclicks_u8_40994','dynclicks_u8_40874','dynclicks_u8_40784','dynclicks_u8_40804','dynclicks_u8_40794','dynclicks_u8_40744','dynclicks_u8_40714','dynclicks_u8_40694','dynclicks_u8_41104'],[41394,41314,41184,40994,40874,40784,40804,40794,40744,40714,40694,41104],"wbnews", 1473072843)</script>
                            </div>
                        </div>
                   
                </div>
            </div>
            <!-- 内容块 end -->
            <!-- footer -->
            <div class="layui-fluid f_bg">
                <div class="layui-container">
                    <div class="foot-mian c-padding-top60 c-padding-bottom60">
                        <div class="foot-box aos-init" aos="fade-down-right"><script language="javascript" src="/system/resource/js/openlink.js"></script><div class="foot-header">
    联系我们
</div>
<div class="foot-body">
<div class="foot-body-box">                 
        <a href="#">地 址:福建省厦门市厦门大学保欣丽英楼</a>                              
    <a href="#">邮 编:361005</a>                              
    <a href="#">邮 箱:smxmu@xmu.edu.cn</a>                              
</div>
</div></div>
                        <div class="foot-box aos-init" aos="fade-up">
                            <div class="foot-header">
                                学校链接
                            </div>
                            <div class="foot-body">
                                <div class="foot-body-box"><a href="https://www.xmu.edu.cn/" target="_blank">厦门大学</a>
                                    
<a href="http://ifas.xmu.edu.cn/cms/Index.aspx" target="_blank">财务管理与会计研究院</a>
                                    
<a href="http://library.xmu.edu.cn/" target="_blank">厦门大学图书馆</a>
                                    
<a href="http://office.xmu.edu.cn/" target="_blank">厦门大学办公室</a>
                                    
<a href="http://std.xmu.edu.cn/" target="_blank">厦门大学科学技术处</a>
                                    
</div>
                                <div class="foot-body-box"><a href="http://skc.xmu.edu.cn/" target="_blank">厦门大学社会科学研究处</a>
<a href="http://zsb.xmu.edu.cn/" target="_blank">厦门大学招生办公室</a>
<a href="http://gs.xmu.edu.cn/" target="_blank">厦门大学研究生院</a>
<a href="http://jwc.xmu.edu.cn/" target="_blank">厦门大学教务处</a>
<a href="http://rsc.xmu.edu.cn/" target="_blank">厦门大学人事处</a>
</div>
                            </div>
                        </div>
                        <div class="foot-box aos-init" aos="fade-down-left">
                            <div class="foot-header">
                                友情链接
                            </div>
                            <div class="foot-body">
                                <div class="foot-body-box"><a href="http://www.moe.gov.cn/" target="_blank"><span>中华人民共和国教育部</span></a>    
                                    
<a href="http://www.mof.gov.cn/index.htm" target="_blank"><span>中华人民共和国财政部</span></a>    
                                    
<a href="http://www.nopss.gov.cn/" target="_blank"><span>全国哲学社会科学工作办公室</span></a>    
                                    
<a href="https://smr.xmu.edu.cn/" target="_blank"><span>管理学院师资科研管理系统</span></a>    
                                    
</div>
                                <div class="foot-body-box"></div>
                            </div>
                        </div>
                    </div>
                </div>
            </div>
            <div class="layui-fluid c-bg-blue">
                <div class="layui-container f-copyright">
                    <div class="layui-row">
                        <div class="layui-col-xs12 layui-col-sm12 layui-col-md12 layui-col-lg6">
                            <div class="f-copyright-left">
                                <img src="../resources/css/images/f_icon01.png">
                                <img src="../resources/css/images/f_icon02.png">
                                <img src="../resources/css/images/f_icon03.png">
                            </div>
                        </div>
                        <div class="layui-col-xs12 layui-col-sm12 layui-col-md12 layui-col-lg6">
                            <div class="f-copyright-right">
                                <span class="f-text">CopyRight ©2022 厦门大学管理学院 版权所有</span>
                                <span class="f-text">技术支持:IT支持部</span>
                                <span class="f-icon">
                                    <i class="iconfont icon-weixin"></i>
                                    <div class="f-icon-img" style="display:none;">
                                        <img src="../resources/css/images/f-icon-img.png">
                                    </div>
                                </span>
                            </div>
                        </div>
                    </div>
                </div>
            </div>
            <!-- footer end -->
    </body>
</html>

使用pyquery库来解析网页文件¶
In [8]:
from pyquery import PyQuery as pq

#通过urllib获得网页源码
page_content = urllib.request.urlopen(page_url).read().decode('utf-8')#decode('utf-8')将得到的内容转换为utf-8编码
doc = pq(page_content)
print(doc)
<html lang="zh">&#13;
    <head>&#13;
        <meta charset="UTF-8"/>&#13;
        <meta name="viewport" content="width=device-width, initial-scale=1.0"/>&#13;
        <meta http-equiv="X-UA-Compatible" content="ie=edge"/>&#13;
        <link rel="stylesheet" type="text/css" href="../resources/layui/css/layui_2022.css"/>&#13;
        <link rel="stylesheet" type="text/css" href="../resources/css/swiper-bundle.min_2022.css"/>&#13;
        <link rel="stylesheet" type="text/css" href="../resources/css/style_2022.css"/>&#13;
        <link rel="stylesheet" type="text/css" href="../resources/css/media.css"/>&#13;
        <script src="../resources/layui/layui_2022.js" type="text/javascript" charset="utf-8"/>&#13;
        <script src="../resources/js/swiper-bundle.min_2022.js" type="text/javascript" charset="utf-8"/>&#13;
        <script src="../resources/js/jquery-1.11.3.min_2022.js" type="text/javascript" charset="utf-8"/>&#13;
        <script src="../resources/js/common_2022.js" type="text/javascript" charset="utf-8"/>&#13;
        <title>学院新闻-厦门大学管理学院-SCHOOL OF MANAGEMENT,XIAMEN UNIVERSITY</title><meta name="pageType" content="2"/>&#13;
<meta name="pageTitle" content="学院新闻"/>&#13;
<meta name="keywords" content="MBA,EMBA,EDP,MPAcc,ME,MTA,ICE,高层培训,总裁办,企业培训,中国MBA,工商管理,管理学院,商学院,China MBA,XiaMen MBA,MPAcc,金融,会计,硕士,管理,经济,管理学院,厦大,厦门管院,厦门大学,厦门大学管理学院,学院新闻"/>&#13;
&#13;
    <!--Announced by Visual SiteBuilder 9-->&#13;
<link rel="stylesheet" type="text/css" href="../_sitegray/_sitegray_d.css"/>&#13;
<script language="javascript" src="../_sitegray/_sitegray.js"/>&#13;
<!-- CustomerNO:77656262657232307778475d50515742000100034e5c -->&#13;
<link rel="stylesheet" type="text/css" href="../2022_newslist.vsb.css"/>&#13;
<script type="text/javascript" src="/system/resource/js/vsbscreen.min.js" id="_vsbscreen" devices="pc|pad"/>&#13;
<script type="text/javascript" src="/system/resource/js/counter.js"/>&#13;
<script type="text/javascript">_jsq_(1049,'/2022_newslist.jsp',-1,1473072843)</script>&#13;
</head>&#13;
    <body class="c-s-bg">&#13;
        <div class="layui-fluid">&#13;
            <div class="c-header">&#13;
                <div class="layui-container c-dis-flex">&#13;
                    <div class="c-logo">&#13;
                        &#13;
<!-- 网站logo图片地址请在本组件"内容配置-网站logo"处填写 -->&#13;
<a href="../index.htm" title="管理学院"><img src="../resources/css/images/logo.png"/></a>&#13;
                    </div>&#13;
                    <div class="c-menu"><ul>&#13;
<li><a href="../xygk/xyjj.htm">学院概况</a>&#13;
        <div class="nav-child">&#13;
                <a href="../xygk/xyjj.htm"><span>学院简介</span></a>&#13;
                <a href="../xygk/xyls.htm"><span>学院历史</span></a>&#13;
                <a href="../xygk/yjysm.htm"><span>愿景与使命</span></a>&#13;
                <a href="../xygk/xyld.htm"><span>学院领导</span></a>&#13;
                <a href="../xygk/xszx.htm"><span>系所中心</span></a>&#13;
                <a href="../xygk/znbm.htm"><span>职能部门</span></a>&#13;
                <a href="../xygk/bszn.htm"><span>办事指南</span></a>&#13;
                <a href="../xygk/lxwm.htm"><span>联系我们</span></a>&#13;
        </div>&#13;
</li>&#13;
<li><a href="djsz.htm">党建思政</a>&#13;
        <div class="nav-child">&#13;
                <a href="djsz/chuxin.htm"><span>初心·使命</span></a>&#13;
                <a href="djsz/dsxx.htm"><span>党史学习</span></a>&#13;
                <a href="djsz/ztjyzl.htm"><span>主题教育专栏</span></a>&#13;
        </div>&#13;
</li>&#13;
<li><a href="https://smr.xmu.edu.cn/TeacherWeb/Teacher_Special_2022.aspx">师资队伍</a>&#13;
        <div class="nav-child">&#13;
                <a href="https://smr.xmu.edu.cn/TeacherWeb/Teacher_Special_2022.aspx"><span>师资队伍</span></a>&#13;
                <a href="../szdw/gjfwxz.htm"><span>国际访问学者</span></a>&#13;
        </div>&#13;
</li>&#13;
<li><a href="../kxyj/kydt.htm">科学研究</a>&#13;
        <div class="nav-child">&#13;
                <a href="../kxyj/kydt.htm"><span>科研动态</span></a>&#13;
                <a href="../kxyj/xshd.htm"><span>学术活动</span></a>&#13;
                <a href="../kxyj/yjzx.htm"><span>研究中心</span></a>&#13;
                <a href="https://smr.xmu.edu.cn"><span>师资科研管理系统</span></a>&#13;
        </div>&#13;
</li>&#13;
<li><a href="../gjjl/gjhgk/gjhgk.htm">国际交流</a>&#13;
        <div class="nav-child">&#13;
                <a href="../gjjl/gjhgk.htm"><span>国际化概况</span></a>&#13;
                <a href="../gjjl/gjrz.htm"><span>国际认证</span></a>&#13;
                <a href="../gjjl/gjhdt.htm"><span>国际化动态</span></a>&#13;
                <a href="../gjjl/xsjlxm.htm"><span>学生交流项目</span></a>&#13;
                <a href="../gjjl/lhpy.htm"><span>联合培养</span></a>&#13;
                <a href="../gjjl/gjxs.htm"><span>国际学生</span></a>&#13;
                <a href="../gjjl/cg_j_zn.htm"><span>出国(境)指南</span></a>&#13;
                <a href="../gjjl/lxwsb.htm"><span>联系外事办</span></a>&#13;
        </div>&#13;
</li>&#13;
<li><a href="http://smcareer.xmu.edu.cn/">职业发展</a>&#13;
</li>&#13;
<li><a href="http://sm-alumni.xmu.edu.cn/">校友联系</a>&#13;
</li>&#13;
</ul></div>&#13;
                    <div class="c-header-right">&#13;
                        <a href="javascript:;" class="navbar-toggler">&#13;
                            <i class="iconfont icon-liebiao"/>&#13;
                        </a>&#13;
                        <a href="javascript:;" id="btn-search">&#13;
                            <i class="iconfont icon-sousuo"/>&#13;
                        </a>&#13;
                        <a href="https://sm.xmu.edu.cn/en">&#13;
                            EN&#13;
                        </a>&#13;
                    </div>&#13;
                    &#13;
&#13;
&#13;
<script language="javascript" src="/system/resource/js/base64.js"/><script language="javascript" src="/system/resource/js/jquery/jquery-latest.min.js"/><script language="javascript" src="/system/resource/vue/vue.js"/><script language="javascript" src="/system/resource/vue/bluebird.min.js"/><script language="javascript" src="/system/resource/vue/axios.js"/><script language="javascript" src="/system/resource/vue/polyfill.js"/><script language="javascript" src="/system/resource/vue/token.js"/><link href="/system/resource/vue/static/element/index.css" type="text/css" rel="stylesheet"/><script language="javascript" src="/system/resource/vue/static/element/index.js"/><script language="javascript" src="/system/resource/vue/static/public.js"/><style>&#13;
    #appu2 .qwss{&#13;
        height: 31px;&#13;
        font-size: 12px;&#13;
        min-width: 190px;&#13;
        max-width: 600px;&#13;
        width: 60%;&#13;
        margin-top: -15px;&#13;
        outline: none;&#13;
        padding-left: 10px;&#13;
        border-radius: 2px;&#13;
        border: 1px solid #e4e7ed;}&#13;
    #appu2 .tj{&#13;
        padding-left: 6px;&#13;
        letter-spacing: 5px;&#13;
        color: white;&#13;
        min-width: 53px;&#13;
        max-width: 150px;&#13;
        height: 32px;&#13;
        border: 0;&#13;
        border-radius: 2px;&#13;
        background-color: #1890FF;&#13;
        position: relative;&#13;
        top: 1px;&#13;
        width: 20%;&#13;
        margin-top: -15px;}&#13;
</style>&#13;
<div id="divu2"/>&#13;
<script type="text/html" id="htmlu2">&#13;
    &lt;div id="appu2" class="search-box"&gt;&#13;
        &lt;div v-if="!isError" class="search"&gt;&#13;
            &lt;input type="text" placeholder="请输入关键字..." autocomplete=off v-model=query.keyWord @keyup.enter="onSubmit"&gt;&#13;
            &#13;
        &lt;/div&gt;&#13;
        &lt;a href="javascript:;" v-on:click="onSubmit()"&gt;&lt;/a&gt;&#13;
        &lt;a href="javascript:;" id="btn-search-close"&gt;&lt;i class="iconfont icon-guanbi_o"&gt;&lt;/i&gt;&lt;/a&gt;&#13;
        &#13;
        &lt;div v-if="isError" style="color: #b30216; font-size:18px;text-align: center;padding:20px;"&gt;&#13;
            应用维护中!&#13;
        &lt;/div&gt;&#13;
    &lt;/div&gt;&#13;
</script>&#13;
<script>&#13;
    $("#divu2").html($("#htmlu2").text());&#13;
</script>&#13;
<script>&#13;
    var appOwner = "1473072843";&#13;
    var token = gettoken(10);&#13;
    var urlPrefix = "/aop_component/";&#13;
&#13;
    jQuery.support.cors = true;&#13;
    $.ajaxSetup({&#13;
        beforeSend: function (request, settings) {&#13;
            request.setRequestHeader("Authorization", token);&#13;
            request.setRequestHeader("owner", appOwner);&#13;
        }&#13;
    });&#13;
&#13;
    new Vue({&#13;
        el: "#appu2",&#13;
        data: function () {&#13;
            return {&#13;
                query: {&#13;
                    keyWord: "",//搜索关键词&#13;
                    owner: appOwner,&#13;
                    token: token,&#13;
                    urlPrefix: urlPrefix,&#13;
                    lang:"i18n_zh_CN"&#13;
                },&#13;
                isError: false&#13;
            }&#13;
        },&#13;
        mounted: function () {&#13;
            var _this = this;&#13;
            // _this.init();&#13;
        },&#13;
        methods: {&#13;
            init: function(){&#13;
                $.ajax({&#13;
                    url: "/aop_component//webber/search/test",&#13;
                    type: "get",&#13;
                    success: function (response) {&#13;
                        if (response.code == "0000") {&#13;
                        } else if (response.code == "220") {&#13;
                            _this.isError = true;&#13;
                            console.log(response);&#13;
                        } else if (!response.code) {&#13;
                            _this.isError = true;&#13;
                            console.log(response);&#13;
                        }&#13;
                    },&#13;
                    error: function (response) {&#13;
                        _this.isError = true;&#13;
                    }&#13;
                });&#13;
            },&#13;
            onSubmit: function (e) {&#13;
                var url = "/views/search/modules/resultpc/soso.html";&#13;
                if ("10" == "1" || "10" == "2") {&#13;
                    url = "https://cmsapp.xmu.edu.cn/" + url;&#13;
                }&#13;
                var _this = this;&#13;
                var query = _this.query;&#13;
                if (url.indexOf("?") &gt; -1) {&#13;
                    url = url.split("?")[0];&#13;
                }&#13;
                if (query.keyWord) {&#13;
                    var query = new Base64().encode(JSON.stringify(query));&#13;
                    window.open(url + "?query=" + query);&#13;
                } else {&#13;
                    alert("请填写搜索内容")&#13;
                }&#13;
            },&#13;
        }&#13;
    })&#13;
</script>&#13;
                </div>&#13;
            </div>&#13;
            </div>&#13;
            <!-- 内页banner -->&#13;
            <div class="layui-fluid c-s-banner">&#13;
                <img src="../resources/css/images/c-bg-img2.png"/>&#13;
            </div>&#13;
            <!-- 内页banner end -->&#13;
            <!-- 内容块 -->&#13;
            <div class="c-ny-fluid">&#13;
                <div class="c-ny-body">&#13;
                    &#13;
                        &#13;
                        <div class="sideBar">&#13;
                            <div class="sideBar-head">&#13;
&#13;
&#13;
&#13;
学院信息</div>&#13;
                            <div class="sideBar-body">&#13;
<ul class="side_nav">&#13;
<input id="M_id" type="hidden" value="nav_12"/>&#13;
<input id="PM_id" type="hidden" value="nav_172"/>&#13;
<li id="nav_" class=" active"><a href="xyxw.htm"><span>学院新闻</span></a>&#13;
</li>                                  &#13;
<li id="nav_"><a href="zsxx.htm"><span>招生信息</span></a>&#13;
</li>                                  &#13;
<li id="nav_"><a href="jwxx.htm"><span>教务信息</span></a>&#13;
</li>                                  &#13;
<li id="nav_"><a href="jwjl.htm"><span>境外交流</span></a>&#13;
</li>                                  &#13;
<li id="nav_"><a href="djsz.htm"><span>党建思政</span><span class="iconfont icon-right"/></a>&#13;
        <div class="side-child">&#13;
            &#13;
                <a href="djsz/chuxin.htm" id="nav_"><span>初心·使命</span></a>&#13;
                <a href="djsz/dsxx.htm" id="nav_"><span>党史学习</span></a>&#13;
                <a href="djsz/ztjyzl.htm" id="nav_"><span>主题教育专栏</span></a>&#13;
           &#13;
        </div>&#13;
</li>                                  &#13;
<li id="nav_"><a href="rsxx.htm"><span>人事信息</span></a>&#13;
</li>                                  &#13;
<li id="nav_"><a href="gzzd.htm"><span>规章制度</span></a>&#13;
</li>                                  &#13;
<li id="nav_"><a href="xyyx.htm"><span>学院影像</span></a>&#13;
</li>                                  &#13;
<li id="nav_"><a href="wjxz.htm"><span>文件下载</span></a>&#13;
</li>                                  &#13;
</ul>&#13;
</div>&#13;
&#13;
<script type="text/javascript">&#13;
                            $(function(){&#13;
                                &#13;
                                setCurrent();&#13;
                                &#13;
                            })&#13;
                            function setCurrent(){&#13;
                                var li_menuid = "li#" +$("#M_id").val();&#13;
                                var a_menuid = "a#" +$("#M_id").val();&#13;
                            &#13;
                                var li_parMenuid = "li#" + $("#PM_id").val();&#13;
                                var a_parMenuid = "a#" + $("#PM_id").val();&#13;
                            &#13;
                                //当前菜单没有子菜单&#13;
                                if (!jQuery.isEmptyObject($(li_menuid))&amp;&amp;$(li_menuid).length &gt; 0){&#13;
                                    $(li_menuid).addClass("active");&#13;
                                }&#13;
                            &#13;
                                //当前菜单有子菜单&#13;
                                if (!jQuery.isEmptyObject($(li_parMenuid))&amp;&amp;$(li_parMenuid).length &gt; 0){&#13;
                                    $(li_parMenuid).addClass("active");&#13;
                                    $(a_menuid).css("color","#B50729");&#13;
                                }&#13;
                            &#13;
                                if (!jQuery.isEmptyObject($(a_parMenuid))&amp;&amp;$(a_parMenuid).length &gt; 0){&#13;
                                    $(a_parMenuid).css("color","#B50729");&#13;
                                    $(a_parMenuid).closest("li").addClass("active");&#13;
                                }&#13;
                            }&#13;
                    &#13;
                        </script>&#13;
                        <style>&#13;
                        .side-child a.on{color:#013d87;}&#13;
                        .side-child p.on{display:block;}&#13;
                        &#13;
                        </style>&#13;
                        </div>&#13;
                        <div class="c-ny-main">&#13;
                            <div class="c-page-head c-dis-flex">&#13;
                                <div class="c-page-title">&#13;
                                    <span class="c-line">&#13;
&#13;
&#13;
&#13;
学院新闻</span>&#13;
                                </div>&#13;
                                <div class="c-page-breadcrumb"><div class="c-page-breadcrumb">&#13;
        <a href="../index.htm">首页</a> / &#13;
        <a href="../xueyuanxx.htm">学院信息</a> / &#13;
        <a href="xyxw.htm">学院新闻</a> / &#13;
</div></div>&#13;
                            </div>&#13;
                            <div class="aaa">&#13;
                                <script language="javascript" src="/system/resource/js/centerCutImg.js"/><script language="javascript" src="/system/resource/js/dynclicks.js"/><script language="javascript" src="/system/resource/js/ajax.js"/><div class="layui-row layui-col-space80 c-list-grid c-padding-top80">&#13;
       &#13;
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_0">&#13;
    <a href="../info/1049/41394.htm" class="c-img-item" target="_blank" title="厦门大学第三届“静木芳林”创业大赛圆满结束">&#13;
        <div class="c-img-16_9">&#13;
            <img src="/__local/6/1E/82/25C88D0B68B087BF708CA86106C_199676F7_29F524.jpg"/>&#13;
        </div>&#13;
        <div class="c-img-content">&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                厦门大学第三届“静木芳林”创业大赛圆满结束&#13;
            </span>&#13;
            <span class="c-img-form">&#13;
                2023-10-16&#13;
            </span>&#13;
        </div>&#13;
    </a>&#13;
</div>&#13;
                                        &#13;
    <span id="section_u8_0" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"/></span>&#13;
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_1">&#13;
    <a href="../info/1049/41314.htm" class="c-img-item" target="_blank" title="蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军">&#13;
        <div class="c-img-16_9">&#13;
            <img src="/__local/D/52/5E/42A0D74CFFAEC15104B8339ED10_28D38704_D4534.jpg"/>&#13;
        </div>&#13;
        <div class="c-img-content">&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军&#13;
            </span>&#13;
            <span class="c-img-form">&#13;
                2023-10-07&#13;
            </span>&#13;
        </div>&#13;
    </a>&#13;
</div>&#13;
                                        &#13;
    <span id="section_u8_1" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"/></span>&#13;
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_2">&#13;
    <a href="../info/1049/41184.htm" class="c-img-item" target="_blank" title="融通中外·商海鸿鹄新征程  博闻古今·上下求索向未来">&#13;
        <div class="c-img-16_9">&#13;
            <img src="/__local/6/63/36/B2259C76A0BFEAEC972FA226CA2_5787963B_61C3F.jpg"/>&#13;
        </div>&#13;
        <div class="c-img-content">&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                融通中外·商海鸿鹄新征程  博闻古今·上下求索向未来&#13;
            </span>&#13;
            <span class="c-img-form">&#13;
                2023-09-20&#13;
            </span>&#13;
        </div>&#13;
    </a>&#13;
</div>&#13;
                                        &#13;
    <span id="section_u8_2" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"/></span>&#13;
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_3">&#13;
    <a href="../info/1049/40994.htm" class="c-img-item" target="_blank" title="国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计专硕党支部开展共建活动">&#13;
        <div class="c-img-16_9">&#13;
            <img src="/__local/7/7F/8B/3454FC8ACD3E00F86D231177116_C44D35AA_9758.jpg"/>&#13;
        </div>&#13;
        <div class="c-img-content">&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计...&#13;
            </span>&#13;
            <span class="c-img-form">&#13;
                2023-09-20&#13;
            </span>&#13;
        </div>&#13;
    </a>&#13;
</div>&#13;
                                        &#13;
    <span id="section_u8_3" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"/></span>&#13;
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_4">&#13;
    <a href="https://mp.weixin.qq.com/s/yzf-K5MMqmF-YJVb3N6B4w" class="c-img-item" target="_blank" title="喜讯 | 管理学院4篇案例在第十四届“全国百篇优秀管理案例”评选中获奖">&#13;
        <div class="c-img-16_9">&#13;
            <img src="/__local/C/E3/A5/0159B9EBF854B2A37EE1E77C668_437CE20D_A51C.jpg"/>&#13;
        </div>&#13;
        <div class="c-img-content">&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                喜讯 | 管理学院4篇案例在第十四届“全国百篇优秀管理案例”评选中获奖&#13;
            </span>&#13;
            <span class="c-img-form">&#13;
                2023-09-13&#13;
            </span>&#13;
        </div>&#13;
    </a>&#13;
</div>&#13;
                                        &#13;
    <span id="section_u8_4" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"/></span>&#13;
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_5">&#13;
    <a href="../info/1049/40784.htm" class="c-img-item" target="_blank" title="管理学院屈文洲教授获评厦门大学2023年“我最喜爱的十位老师”">&#13;
        <div class="c-img-16_9">&#13;
            <img src="/__local/B/DE/0C/E7717199B0703CD7C1F8EA26B21_B9647A8F_4BB08.jpg"/>&#13;
        </div>&#13;
        <div class="c-img-content">&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                管理学院屈文洲教授获评厦门大学2023年“我最喜爱的十位老师”&#13;
            </span>&#13;
            <span class="c-img-form">&#13;
                2023-09-11&#13;
            </span>&#13;
        </div>&#13;
    </a>&#13;
</div>&#13;
                                        &#13;
    <span id="section_u8_5" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"/></span>&#13;
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_6">&#13;
    <a href="../info/1049/40804.htm" class="c-img-item" target="_blank" title="入学教育|管理学院、财务管理与会计研究院开展研究生新生入学教育系列讲座">&#13;
        <div class="c-img-16_9">&#13;
            <img src="/__local/5/F0/4A/B12E815FC40064CA8221F8ED8BE_33B717AA_BD22C.jpg"/>&#13;
        </div>&#13;
        <div class="c-img-content">&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                入学教育|管理学院、财务管理与会计研究院开展研究生新生入学教育系列讲座&#13;
            </span>&#13;
            <span class="c-img-form">&#13;
                2023-09-11&#13;
            </span>&#13;
        </div>&#13;
    </a>&#13;
</div>&#13;
                                        &#13;
    <span id="section_u8_6" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"/></span>&#13;
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_7">&#13;
    <a href="../info/1049/40794.htm" class="c-img-item" target="_blank" title="入学教育|管理学院举办2023级本科新生见面会">&#13;
        <div class="c-img-16_9">&#13;
            <img src="/__local/4/3B/1D/262369D70EFB5DAE2B32A11AC5E_6E90F028_345484.jpg"/>&#13;
        </div>&#13;
        <div class="c-img-content">&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                入学教育|管理学院举办2023级本科新生见面会&#13;
            </span>&#13;
            <span class="c-img-form">&#13;
                2023-09-11&#13;
            </span>&#13;
        </div>&#13;
    </a>&#13;
</div>&#13;
                                        &#13;
    <span id="section_u8_7" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"/></span>&#13;
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_8">&#13;
    <a href="../info/1049/40744.htm" class="c-img-item" target="_blank" title="管理学院举行2023年新教职工座谈会">&#13;
        <div class="c-img-16_9">&#13;
            <img src="/__local/B/3A/90/124F0205380529FE7358BF802B0_73A17B95_61030.jpg"/>&#13;
        </div>&#13;
        <div class="c-img-content">&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                管理学院举行2023年新教职工座谈会&#13;
            </span>&#13;
            <span class="c-img-form">&#13;
                2023-09-10&#13;
            </span>&#13;
        </div>&#13;
    </a>&#13;
</div>&#13;
                                        &#13;
    <span id="section_u8_8" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"/></span>&#13;
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_9">&#13;
    <a href="../info/1049/40714.htm" class="c-img-item" target="_blank" title="管理学院、财务管理与会计研究院2023级新生开学典礼暨院长第一课圆满举行">&#13;
        <div class="c-img-16_9">&#13;
            <img src="/__local/3/62/0B/2CB313AB9B6DB42CC03A22F1192_20B43439_29A0D.jpg"/>&#13;
        </div>&#13;
        <div class="c-img-content">&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                管理学院、财务管理与会计研究院2023级新生开学典礼暨院长第一课圆满举行&#13;
            </span>&#13;
            <span class="c-img-form">&#13;
                2023-09-09&#13;
            </span>&#13;
        </div>&#13;
    </a>&#13;
</div>&#13;
                                        &#13;
    <span id="section_u8_9" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"/></span>&#13;
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_10">&#13;
    <a href="../info/1049/40694.htm" class="c-img-item" target="_blank" title="管理学院传达学习厦门大学第十二次党代会精神">&#13;
        <div class="c-img-16_9">&#13;
            <img src="/__local/C/62/D9/FA84496B76078A28093BD0B3189_84A51490_4B117.jpg"/>&#13;
        </div>&#13;
        <div class="c-img-content">&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                管理学院传达学习厦门大学第十二次党代会精神&#13;
            </span>&#13;
            <span class="c-img-form">&#13;
                2023-09-08&#13;
            </span>&#13;
        </div>&#13;
    </a>&#13;
</div>&#13;
                                        &#13;
    <span id="section_u8_10" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"/></span>&#13;
<div class="layui-col-xs12 layui-col-sm6 layui-col-md6 layui-col-lg4" id="line_u8_11">&#13;
    <a href="https://mp.weixin.qq.com/s/-T5cRmO7t87lIiSk_g8dog" class="c-img-item" target="_blank" title="厦门大学2023级MBA新生开学典礼顺利举行">&#13;
        <div class="c-img-16_9">&#13;
            <img src="/__local/A/94/81/E421B8648A68387F73E9D469407_7A78069A_3D6B84.jpg"/>&#13;
        </div>&#13;
        <div class="c-img-content">&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                厦门大学2023级MBA新生开学典礼顺利举行&#13;
            </span>&#13;
            <span class="c-img-form">&#13;
                2023-09-06&#13;
            </span>&#13;
        </div>&#13;
    </a>&#13;
</div>&#13;
                                        &#13;
    <span id="section_u8_11" style="display:none;"><hr style="height:1px;border:none;border-top:1px dashed #CCCCCC;"/></span>&#13;
</div>&#13;
&#13;
<div class="page">&#13;
        <!-- 分页 -->&#13;
        <link rel="stylesheet" content-type="text/css" href="/system/resource/css/pagedown/sys.css"/><div class="pb_sys_common pb_sys_normal2 pb_sys_style6" style="margin-top:10px;text-align:center;"><span class="p_pages"><span class="p_first_d p_fun_d">首页</span><span class="p_prev_d p_fun_d">上页</span><span class="p_no_d">1</span><span class="p_no"><a href="xyxw/112.htm">2</a></span><span class="p_no"><a href="xyxw/111.htm">3</a></span><span class="p_no"><a href="xyxw/110.htm">4</a></span><span class="p_no"><a href="xyxw/109.htm">5</a></span><span class="p_dot">...</span><span class="p_no"><a href="xyxw/1.htm">113</a></span><span class="p_next p_fun"><a href="xyxw/112.htm">下页</a></span><span class="p_last p_fun"><a href="xyxw/1.htm">尾页</a></span></span></div>&#13;
&#13;
</div><script>_showDynClickBatch(['dynclicks_u8_41394','dynclicks_u8_41314','dynclicks_u8_41184','dynclicks_u8_40994','dynclicks_u8_40874','dynclicks_u8_40784','dynclicks_u8_40804','dynclicks_u8_40794','dynclicks_u8_40744','dynclicks_u8_40714','dynclicks_u8_40694','dynclicks_u8_41104'],[41394,41314,41184,40994,40874,40784,40804,40794,40744,40714,40694,41104],"wbnews", 1473072843)</script>&#13;
                            </div>&#13;
                        </div>&#13;
                   &#13;
                </div>&#13;
            </div>&#13;
            <!-- 内容块 end -->&#13;
            <!-- footer -->&#13;
            <div class="layui-fluid f_bg">&#13;
                <div class="layui-container">&#13;
                    <div class="foot-mian c-padding-top60 c-padding-bottom60">&#13;
                        <div class="foot-box aos-init" aos="fade-down-right"><script language="javascript" src="/system/resource/js/openlink.js"/><div class="foot-header">&#13;
    联系我们&#13;
</div>&#13;
<div class="foot-body">&#13;
<div class="foot-body-box">                 &#13;
        <a href="#">地 址:福建省厦门市厦门大学保欣丽英楼</a>                              &#13;
    <a href="#">邮 编:361005</a>                              &#13;
    <a href="#">邮 箱:smxmu@xmu.edu.cn</a>                              &#13;
</div>&#13;
</div></div>&#13;
                        <div class="foot-box aos-init" aos="fade-up">&#13;
                            <div class="foot-header">&#13;
                                学校链接&#13;
                            </div>&#13;
                            <div class="foot-body">&#13;
                                <div class="foot-body-box"><a href="https://www.xmu.edu.cn/" target="_blank">厦门大学</a>&#13;
                                    &#13;
<a href="http://ifas.xmu.edu.cn/cms/Index.aspx" target="_blank">财务管理与会计研究院</a>&#13;
                                    &#13;
<a href="http://library.xmu.edu.cn/" target="_blank">厦门大学图书馆</a>&#13;
                                    &#13;
<a href="http://office.xmu.edu.cn/" target="_blank">厦门大学办公室</a>&#13;
                                    &#13;
<a href="http://std.xmu.edu.cn/" target="_blank">厦门大学科学技术处</a>&#13;
                                    &#13;
</div>&#13;
                                <div class="foot-body-box"><a href="http://skc.xmu.edu.cn/" target="_blank">厦门大学社会科学研究处</a>&#13;
<a href="http://zsb.xmu.edu.cn/" target="_blank">厦门大学招生办公室</a>&#13;
<a href="http://gs.xmu.edu.cn/" target="_blank">厦门大学研究生院</a>&#13;
<a href="http://jwc.xmu.edu.cn/" target="_blank">厦门大学教务处</a>&#13;
<a href="http://rsc.xmu.edu.cn/" target="_blank">厦门大学人事处</a>&#13;
</div>&#13;
                            </div>&#13;
                        </div>&#13;
                        <div class="foot-box aos-init" aos="fade-down-left">&#13;
                            <div class="foot-header">&#13;
                                友情链接&#13;
                            </div>&#13;
                            <div class="foot-body">&#13;
                                <div class="foot-body-box"><a href="http://www.moe.gov.cn/" target="_blank"><span>中华人民共和国教育部</span></a>    &#13;
                                    &#13;
<a href="http://www.mof.gov.cn/index.htm" target="_blank"><span>中华人民共和国财政部</span></a>    &#13;
                                    &#13;
<a href="http://www.nopss.gov.cn/" target="_blank"><span>全国哲学社会科学工作办公室</span></a>    &#13;
                                    &#13;
<a href="https://smr.xmu.edu.cn/" target="_blank"><span>管理学院师资科研管理系统</span></a>    &#13;
                                    &#13;
</div>&#13;
                                <div class="foot-body-box"/>&#13;
                            </div>&#13;
                        </div>&#13;
                    </div>&#13;
                </div>&#13;
            </div>&#13;
            <div class="layui-fluid c-bg-blue">&#13;
                <div class="layui-container f-copyright">&#13;
                    <div class="layui-row">&#13;
                        <div class="layui-col-xs12 layui-col-sm12 layui-col-md12 layui-col-lg6">&#13;
                            <div class="f-copyright-left">&#13;
                                <img src="../resources/css/images/f_icon01.png"/>&#13;
                                <img src="../resources/css/images/f_icon02.png"/>&#13;
                                <img src="../resources/css/images/f_icon03.png"/>&#13;
                            </div>&#13;
                        </div>&#13;
                        <div class="layui-col-xs12 layui-col-sm12 layui-col-md12 layui-col-lg6">&#13;
                            <div class="f-copyright-right">&#13;
                                <span class="f-text">CopyRight ©2022 厦门大学管理学院 版权所有</span>&#13;
                                <span class="f-text">技术支持:IT支持部</span>&#13;
                                <span class="f-icon">&#13;
                                    <i class="iconfont icon-weixin"/>&#13;
                                    <div class="f-icon-img" style="display:none;">&#13;
                                        <img src="../resources/css/images/f-icon-img.png"/>&#13;
                                    </div>&#13;
                                </span>&#13;
                            </div>&#13;
                        </div>&#13;
                    </div>&#13;
                </div>&#13;
            </div>&#13;
            <!-- footer end -->&#13;
    </body>&#13;
</html>
In [9]:
doc('.aaa')
Out[9]:
[<div.aaa>]
In [10]:
#获得所有class="aaa"标签下的div标签下的a标签下的div标签下的第一个span,并返回为一个PyQuery类型的对象
news_list = doc('.aaa div a div span:first-child')
print(news_list)
<span class="c-img-item-title c-line-clamp">&#13;
                厦门大学第三届“静木芳林”创业大赛圆满结束&#13;
            </span>&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军&#13;
            </span>&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                融通中外·商海鸿鹄新征程  博闻古今·上下求索向未来&#13;
            </span>&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计...&#13;
            </span>&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                喜讯 | 管理学院4篇案例在第十四届“全国百篇优秀管理案例”评选中获奖&#13;
            </span>&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                管理学院屈文洲教授获评厦门大学2023年“我最喜爱的十位老师”&#13;
            </span>&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                入学教育|管理学院、财务管理与会计研究院开展研究生新生入学教育系列讲座&#13;
            </span>&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                入学教育|管理学院举办2023级本科新生见面会&#13;
            </span>&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                管理学院举行2023年新教职工座谈会&#13;
            </span>&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                管理学院、财务管理与会计研究院2023级新生开学典礼暨院长第一课圆满举行&#13;
            </span>&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                管理学院传达学习厦门大学第十二次党代会精神&#13;
            </span>&#13;
            <span class="c-img-item-title c-line-clamp">&#13;
                厦门大学2023级MBA新生开学典礼顺利举行&#13;
            </span>&#13;
            
In [11]:
#使用items()获得所有新闻并返回一个列表
#注意:这里返回的列表中的每一个元素仍然是PyQuery类型的元素
news_list = doc('.aaa div a div span:first-child').items()
#遍历列表并输出标签中的文本
for n in news_list:
    print(n.text())
厦门大学第三届“静木芳林”创业大赛圆满结束
蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军
融通中外·商海鸿鹄新征程 博闻古今·上下求索向未来
国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计...
喜讯 | 管理学院4篇案例在第十四届“全国百篇优秀管理案例”评选中获奖
管理学院屈文洲教授获评厦门大学2023年“我最喜爱的十位老师”
入学教育|管理学院、财务管理与会计研究院开展研究生新生入学教育系列讲座
入学教育|管理学院举办2023级本科新生见面会
管理学院举行2023年新教职工座谈会
管理学院、财务管理与会计研究院2023级新生开学典礼暨院长第一课圆满举行
管理学院传达学习厦门大学第十二次党代会精神
厦门大学2023级MBA新生开学典礼顺利举行
In [12]:
#获得所有class="aaa"标签下的第四个div标签下的a标签
news_list = doc('.aaa div:nth-child(4) a').items()
#遍历列表并输出超链接中的title
for n in news_list:
    print(n.attr('title'))
厦门大学第三届“静木芳林”创业大赛圆满结束
蝉联季军 英雄凯旋:厦大戈18代表队再次荣获季军
融通中外·商海鸿鹄新征程  博闻古今·上下求索向未来
国家金融监督管理总局厦门监管局青年干部与我院2022级审计专硕党支部、2023级会计专硕党支部开展共建活动
喜讯 | 管理学院4篇案例在第十四届“全国百篇优秀管理案例”评选中获奖
管理学院屈文洲教授获评厦门大学2023年“我最喜爱的十位老师”
入学教育|管理学院、财务管理与会计研究院开展研究生新生入学教育系列讲座
入学教育|管理学院举办2023级本科新生见面会
管理学院举行2023年新教职工座谈会
管理学院、财务管理与会计研究院2023级新生开学典礼暨院长第一课圆满举行
管理学院传达学习厦门大学第十二次党代会精神
厦门大学2023级MBA新生开学典礼顺利举行

使用Selenium进行数据爬取¶

In [13]:
#有些网站对程序爬虫进行了限制,如果直接发送请求就会出现错误,比如豆瓣
import urllib.request

page_url = 'https://movie.douban.com/subject/25845392/reviews?sort=hotest&start=0'
page_content = urllib.request.urlopen(page_url).read().decode('utf-8')
print(page_content)
---------------------------------------------------------------------------
HTTPError                                 Traceback (most recent call last)
~\AppData\Local\Temp\ipykernel_16940\1262524363.py in <module>
      3 
      4 page_url = 'https://movie.douban.com/subject/25845392/reviews?sort=hotest&start=0'
----> 5 page_content = urllib.request.urlopen(page_url).read().decode('utf-8')
      6 print(page_content)

C:\ProgramData\Anaconda3\lib\urllib\request.py in urlopen(url, data, timeout, cafile, capath, cadefault, context)
    212     else:
    213         opener = _opener
--> 214     return opener.open(url, data, timeout)
    215 
    216 def install_opener(opener):

C:\ProgramData\Anaconda3\lib\urllib\request.py in open(self, fullurl, data, timeout)
    521         for processor in self.process_response.get(protocol, []):
    522             meth = getattr(processor, meth_name)
--> 523             response = meth(req, response)
    524 
    525         return response

C:\ProgramData\Anaconda3\lib\urllib\request.py in http_response(self, request, response)
    630         # request was successfully received, understood, and accepted.
    631         if not (200 <= code < 300):
--> 632             response = self.parent.error(
    633                 'http', request, response, code, msg, hdrs)
    634 

C:\ProgramData\Anaconda3\lib\urllib\request.py in error(self, proto, *args)
    559         if http_err:
    560             args = (dict, 'default', 'http_error_default') + orig_args
--> 561             return self._call_chain(*args)
    562 
    563 # XXX probably also want an abstract factory that knows when it makes

C:\ProgramData\Anaconda3\lib\urllib\request.py in _call_chain(self, chain, kind, meth_name, *args)
    492         for handler in handlers:
    493             func = getattr(handler, meth_name)
--> 494             result = func(*args)
    495             if result is not None:
    496                 return result

C:\ProgramData\Anaconda3\lib\urllib\request.py in http_error_default(self, req, fp, code, msg, hdrs)
    639 class HTTPDefaultErrorHandler(BaseHandler):
    640     def http_error_default(self, req, fp, code, msg, hdrs):
--> 641         raise HTTPError(req.full_url, code, msg, hdrs, fp)
    642 
    643 class HTTPRedirectHandler(BaseHandler):

HTTPError: HTTP Error 418: 
In [1]:
#使用selenium来调用浏览器打开网页,绕过网站的反爬虫限制
from selenium import webdriver

chrome_driver_file = r'C:\Program Files\Google\Chrome\Application\chromedriver.exe'#这个路径就是chromedriver.exe的存放位置,可以自己设置
b = webdriver.Chrome(executable_path=chrome_driver_file)
url = "https://movie.douban.com/subject/25845392/reviews?sort=hotest&start=0"
b.get(url)
C:\Users\fangb\AppData\Local\Temp\ipykernel_27048\682826816.py:5: DeprecationWarning: executable_path has been deprecated, please pass in a Service object
  b = webdriver.Chrome(executable_path=chrome_driver_file)
In [15]:
#使用xpath的方式来查找一条评论
from selenium.webdriver.common.by import By

a_review = b.find_element(By.XPATH, '//*[@id="content"]/div/div[1]/div[1]/div[3]/div/div/div[1]')
print(a_review.text)
长津湖好哭的点其实不是硬煽情, 影片节奏还挺快的,特别是进入战斗部分之后,一场战斗结束,你还没来得及哭,战士们已经进入下一个阶段了。 因为影片没有预备时间给观众流泪,所以观影中,我只感到震撼、憋屈、以及联与当今现实对照的感慨。 片中,因为没有制空权,我们还没奔...  (展开)
In [16]:
#使用xpath的方式来查找所有评论并返回列表
#注意:方法改成了find_elements_by_xpath();xpath最后一个div的索引标记删除,表示返回所有div
reviews = b.find_elements(By.XPATH,'//*[@id="content"]/div/div[1]/div[1]/div/div/div/div[1]')
for r in reviews:
    print(r.text)
    print('-------------------------------')
看了长津湖,先来说说长津湖 前期这部片子宣传 造势都很强 据说投资大 成本高 又是3位比较有名的导演制作 于是抱着值得一看的心态去看了 整个故事情节很散 可以说没有一个完整的情节闭合 当我感觉马上要到最精彩的地方的时候就莫名结束了 一上来就打 观影的整个过程脑壳里充...  (展开)
-------------------------------
这篇影评可能有剧透
很久以后我才知道, 九岁和十九岁的中间有十年, 十九岁和二十九岁的中间, 却有一生。 我叫伍万里, 读万卷书,行万里路。 我虽然没有读过万卷书, 但有些人,一生下来就注定要行万里路。 四处漂泊,无法落脚。 但偏偏就在我十九岁的时候, 在抗美援朝的路上, 那个戴着红围巾...  (展开)
-------------------------------
长津湖好哭的点其实不是硬煽情, 影片节奏还挺快的,特别是进入战斗部分之后,一场战斗结束,你还没来得及哭,战士们已经进入下一个阶段了。 因为影片没有预备时间给观众流泪,所以观影中,我只感到震撼、憋屈、以及联与当今现实对照的感慨。 片中,因为没有制空权,我们还没奔...  (展开)
-------------------------------
如今的电影工业早已让战争片的场面达到了二十年前无法想象的境界,但《大决战三部曲》、《血战台儿庄》这些8、90年代的作品却依然被誉为国产战争片的巅峰,这其中的原因,尽在这部国庆档大作之中。 三个小时篇幅还原长津湖战役,本来绰绰有余,但编导团队在追求视觉效果和主旋...  (展开)
-------------------------------
这篇影评可能有剧透
太多太多的细节一刷肯定是看不尽记不全的,对比、隐喻、致敬用的水到渠成,很多彩蛋有待观众们共同挖掘。 铭记历史的用意也远不止于过去,70年前的仗我们在冰天雪地里打完了,70年后的电影里,背景中再二再三的朗读报道、横幅标语、石头碑刻上横竖都写着“一定要收复台湾”。从...  (展开)
-------------------------------
——后的都是后加的吐槽 1. 这几个成名已久的导演,同样是主旋律,看看俄罗斯的《最后的前线》怎么拍的!养尊处优,吃饭的把式都玩不转!拍的一锅粥,小情小调,插科打诨!真TM愧对先烈!!! ——这三导演加主演拉东北冬天山区里,能穿都穿上,在野外睡三天,再拍这片子应该能...  (展开)
-------------------------------
这篇影评可能有剧透
看完《长津湖》,我的心情久久不能平静。造成不平静的原因,和以往看片不一样,不是因为这部片太好或者太差,而是因为这样的故事从来不在自己的认知范围内,而你还知道它是真的,这种感觉让人无法平静。 以一个相同规模大制作的史诗级战争片标准来衡量,《长津湖》确实还可以更...  (展开)
-------------------------------
从影院出来有种恍如隔世的感觉 中国人,总是被他们之中最勇敢的人保护得很好 徐峥说看完这样的电影就觉得语言特别的苍白无力 出来看着熙熙攘攘的人群,热热闹闹的商场,老人们安逸的牌局,想说声谢谢但也太轻了 我不是历史迷也不是军迷,作为大多数中普普通通的一个,真的很惭...  (展开)
-------------------------------
我看了后,感觉没有原来老抗美援朝电影的味道,商业大片, 易烊千玺 演的角色就是败笔,吊儿郎当的样子,开始不说了,后边都说部队再济南还是哪整训了,然后再火车上还是那个鸟样子。现在很多电影电视塑造的士兵根本没个兵样子,都是痞子样。战争场面前边的仁川登陆真假,还...  (展开)
-------------------------------
近期去看了电影《长津湖》心情久久不能平复,一个原因就是我的爷爷也参加过抗美援朝,在黄草岭阻击战中,当时仅20出头的他,就用手榴弹俘虏了几个美国士兵,在缺衣少粮的大雪中奋战了整整14天,最终落下了手被冻伤的病根,而现在年事已高的他冻伤也愈发严重了,从小沐浴在和平...  (展开)
-------------------------------
这篇影评可能有剧透
昨晚看完了长津湖。出来之后,老公问我怎么样,我红着眼圈说,深受震撼,深受教育。电影场里,我的背后一直有抽泣声。但我右边的女生估计是陪同伴来的,一直不耐烦地过一段时间刷一下手机,还在座位上左动右动,我老公左边的男人在电影后半程,一边在手机上打游戏,一边说这个...  (展开)
-------------------------------
看到这个镜头的时候,简直懵圈。想知道徐克、陈凯歌、林超贤这三位大导演在处理这个画面的时候是否记得自己是在拍电影,而不是做PPT汇报演出?有什么剪辑手法是不能处理这段叙事的,非要用这么简单粗暴的方式来呈现…… 包括后面美军感恩节食物丰盛,我军忍饥挨饿也是十分粗暴...  (展开)
-------------------------------
长津湖主要有几个很大的问题,导致我对这部电影很失望 1. 长津湖战役是抗美援朝中极其惨烈的一场战斗,影片中完全没有看出惨烈的一面。志愿军与美军的冲突实在是过于轻松。我认为这种修改角度,对于志愿军烈士,反而是种不尊重。 2. 长津湖战役是东线发生的第一场战斗,通信塔...  (展开)
-------------------------------
这篇影评可能有剧透
终于看了《长津湖》。 这是一个让人不敢贸然碰触却又不容错过的题材。因为这场发生在极度寒冷、志愿军物资极度匮乏下的战争,是何等惨烈、残酷而又震撼人心;因为那么多志愿军战士在极限情况下,以血肉之躯对抗“武装到牙齿”的美军,并取得了艰苦卓绝的胜利;因为在冰天雪地、...  (展开)
-------------------------------
7.1分左右。 林超贤的暴力,徐克的五毛特效,陈凯歌的二流青年文学,用一段壮烈的历史拍了这一部将近三个小时却依旧讲得稀里糊涂的电影。几个导演的影子在里面相当明显,本来还以为会分段叙事,一人一个单元,但估计怕“谁丑谁尴尬”(参照《我和我的祖国》),索性集各家之长,...  (展开)
-------------------------------
《长津湖》才上映两天,各种评价就已经铺天盖地,大概是因为已经被剧透过了,有些缺点已经知道而且预期降低了,所以最后看下来整体观感还挺好。以下是看完了回来的瞎写写。 观感好不好主要是看期待吧。如果预期是想看一部像《大决战》系列那样全面讲述长津湖战役的电影,那比较...  (展开)
-------------------------------
长津湖战役是抗美援朝中双方都不太愿意去提及的一场血战!我们的战斗伤亡和非战斗减员都十分巨大,以至于9兵团休整了5个月才恢复元气;而美军陆战一师伤亡过半,士气直接被打掉了!这可是在太平洋战场上打得日军鬼哭狼嚎尸横遍野的王牌中的王牌! 影片中两场战斗一场护送电台和...  (展开)
-------------------------------
这篇影评可能有剧透
写在前面: 说《长津湖》难看不等于不认同长津湖战役,同理,不喜欢一部电影也不应该等同于不爱国。 前有《八佰》《金刚川》,这部集结了陈凯歌、林超贤、徐克三位导演、耗资13亿的战争片,还是非常值得期待的。 但往往期待越大失望也越大。套用一些观众看完的观感:全世界已经...  (展开)
-------------------------------
整个三小时,没有一个亮点吸引我,豆瓣给7.6给高了,完全没有真实拍摄出抗美援朝的震撼。陈凯歌导游其实拍的很多影视都不是太理想,这次更让我坚信这位导演的水平很次。吴京已经不适合拍电影了,娱乐业孤立他,我看离大众孤立已经不远了,你拍爱国我们都喜欢,只是你拿爱国去吸...  (展开)
-------------------------------
【IMAX《长津湖》!】 一定要看一场IMAX的!……不血腥,但战争场面宏大震撼,绝不亚于任何国内外的大片! 感谢屁股正到不行的陈凯歌导演。 我不想看那些虚头八脑的所谓“反战”。“打得一拳开,免得百拳来”,才是真正的反战。 我们不是战争的发起方,但是,我是不怕任何方面...  (展开)
-------------------------------
In [2]:
b.quit()#关闭浏览器

多进程和多线程¶

In [18]:
#没有多进程或者多线程的情况,依次运行代码
import time

for i in range(3):
    time.sleep(2)#程序暂停2秒
    print('测试{}@{}'.format(i,time.ctime(time.time())))
测试0@Thu Oct 13 10:38:11 2022
测试1@Thu Oct 13 10:38:13 2022
测试2@Thu Oct 13 10:38:15 2022
In [ ]:
#注意,以下代码仅在命令行界面运行通过,需要将代码另存为一个py文件后在命令行界面运行
import multiprocessing
import datetime
import time

class MyProcess(multiprocessing.Process): #继承Process类
    def __init__(self, name):
        #super()表示这个类的父类,即multiprocessing.Process
        super().__init__()
        self.name = name

    def run(self):
        time.sleep(2)
        print('测试多进程{}@{}'.format(self.name,time.ctime(time.time())))


if __name__ == '__main__':
    p1 = MyProcess('Python1') #实例化进程对象1
    p2 = MyProcess('Python2') #实例化进程对象2
    p3 = MyProcess('Python3') #实例化进程对象3
    #启动进程
    p1.start()
    p2.start()
    p3.start()
    #用join使得其它进程结束后主进程才结束
    p1.join()
    p2.join()
    p3.join()
    
    print('测试结束')
运行结果为(1、2、3的顺序随机):¶

测试多进程Python1@Thu Oct 15 21:11:43 2021
测试多进程Python3@Thu Oct 15 21:11:43 2021
测试多进程Python2@Thu Oct 15 21:11:43 2021
测试结束

注意:如果不加 join() 则结果为(先运行了print('测试结束')):¶

测试结束
测试多进程Python1@Thu Oct 15 21:12:01 2021
测试多进程Python3@Thu Oct 15 21:12:01 2021
测试多进程Python2@Thu Oct 15 21:12:01 2021

In [20]:
import threading
import datetime
import time

class MyThread(threading.Thread): #继承Thread类
    def __init__(self, name):
        #此处threading.Thread也可以用super()来替代
        threading.Thread.__init__(self)
        self.name = name

    def run(self):
        time.sleep(2)
        print('测试多线程{}@{}'.format(self.name,time.ctime(time.time())))


if __name__ == '__main__':
    p1 = MyThread('Python1') #实例化线程对象1
    p2 = MyThread('Python2') #实例化线程对象2
    p3 = MyThread('Python3') #实例化线程对象3
    #启动线程
    p1.start()
    p2.start()
    p3.start()
    p1.join()
    p2.join()
    p3.join()
    
    print('测试结束')
测试多线程Python3@Thu Oct 13 10:47:21 2022测试多线程Python2@Thu Oct 13 10:47:21 2022
测试多线程Python1@Thu Oct 13 10:47:21 2022

测试结束
In [ ]: