天天育儿网,内容丰富有趣,生活中的好帮手!
天天育儿网 > 以正方教务系统为例 用php模拟登陆抓取课表 空教室

以正方教务系统为例 用php模拟登陆抓取课表 空教室

时间:2024-03-02 13:11:49

相关推荐

以正方教务系统为例 用php模拟登陆抓取课表 空教室

后端开发|php教程

curl,gt,post,cookie,result

后端开发-php教程

课程格子和超级课程表这两个应用,想必大学生都很熟悉,使用自己的学号和教务系统的密码,就可以将自己的课表导入,随时随地都可以在手机上查看。

简介单页源码,ubuntu设置库路径,爬虫怎么下载小说,php审批,seo 与前端lzw

其实稍微了解一点php的话,我们也可以做一个类似这样的web 应用。

共享支付系统源码,ubuntu的麒麟版本,搭建一个简易的tomcat,网络爬虫炒期货,php输出数据库两字段乘积,上海seo快照lzw

1,解决掉验证码

sqlserver cms 源码,安装ubuntu竖屏,tomcat控制台文件日志,phtyon爬虫接单平台,php简单冒泡算法菜鸟教程交流,肥城网站seolzw

其实这是正方的一个小bug,当我们进入登陆界面时,浏览器会去请求服务器,服务器会生成一个验证码图片。如果我们不去请求这个图片,那么正方后台也不会生成相应的 验证码,于是这样我们就有了可乘之机,让我高兴会儿~这时,我们在不填写验证码的情况下,可以很流畅的进入。大家可以在自己的电脑上禁止访问验证码的地址,然后试试这 是不是真的~当然,这只对正方有效。

2,php 的curl 模拟登陆

这里直接贴一个脚本之家对 curl 的讲解吧 /article/51299.htm

接下来就是相关代码了,相信很多人和我一样,只喜欢看例子,对于长篇大论的讲解,转头就走……不过这个习惯还是不好……废话不多说!

//模拟登陆function curl_request($url,$post=\,$cookie=\, $returnCookie=0){ $curl = curl_init(); curl_setopt($curl, CURLOPT_URL, $url); curl_setopt($curl, CURLOPT_USERAGENT, Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0)); curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1); curl_setopt($curl, CURLOPT_AUTOREFERER, 1); curl_setopt($curl, CURLOPT_REFERER, "这里一定要换成教务系统登陆的url"); //填写教务系统url if($post) { curl_setopt($curl, CURLOPT_POST, 1); curl_setopt($curl, CURLOPT_POSTFIELDS, http_build_query($post)); } if($cookie) { curl_setopt($curl, CURLOPT_COOKIE, $cookie); } curl_setopt($curl, CURLOPT_HEADER, $returnCookie); curl_setopt($curl, CURLOPT_TIMEOUT, 20); curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1); $data = curl_exec($curl); if (curl_errno($curl)) { return curl_error($curl); } curl_close($curl); if($returnCookie){ list($header, $body) = explode("\r\n\r\n", $data, 2); preg_match_all("/Set\-Cookie:([^;]*);/", $header, $matches); $info[cookie] = substr($matches[1][0], 1); $info[content] = $body; return $info; }else{ return $data; } }

3,教务系统登陆页面的隐藏字段

举个栗子

这些东西在登陆的时候也是需要带上的,顺便贴出函数,顺便暴漏了博主的学校……皇家种地大学(主要是正则表达式的运用)

//登陆页面的隐藏字段

function getView(){ $url = http://jw./default2.aspx; $result = curl_request($url); $pattern = //is; preg_match_all($pattern, $result, $matches); $res[0] = $matches[1][0]; return $res[0] ;}

//返回教室查询页面的隐藏值

private function getViewJs($cookie,$xh){

$url = “http://jw./xxjsjy.aspx?xh={$xh}”;

$result = curl_request($url,”,$cookie);

$pattern = ‘//is’;

preg_match_all($pattern, $result, $matches);

$res[0] = $matches[1][0];

return $res[0] ;

}

4,cookie 的获取

function login($xh,$pwd){ $url = http://jw./default2.aspx; $post[\__VIEWSTATE] = $this->getView(); $post[ xtUserName] = $xh; //填写学号 $post[TextBox2] = $pwd; //填写密码 $post[ xtSecretCode] = \; $post[lbLanguage] = \; $post[hidPdrs] = \; $post[hidsc] = \; $post[RadioButtonList1] = iconv(utf-8, gb2312, 学生); $post[Button1] = iconv(utf-8, gb2312, 登录); $result = curl_request($url,$post,\, 1); return $result[cookie];}

5,让我们来试试查课表的功能,格式有点乱额,大家凑合着看,我把课表转成了一个二维关联数组

//返回课表字符串private function classresult($xh,$pwd){ date_default_timezone_set("PRC"); //时区设置 $classList = "";//声明课表变量 $cookie = $this->login($xh,$pwd); $view = $this->getViewJs($cookie,$xh);//验证密码是否正确 //如果密码正确 if (!empty($view)) { $url = "http://jw./xskbcx.aspx?xh={$xh}"; $result = curl_request($url,\,$cookie); //保存的cookiespreg_match_all(/

([\w\W]*?)/,$result,$out); $table = $out[0][0]; //获取整个课表 preg_match_all(/
([\w\W]*?)/,$table,$out); $td = $out[1]; $length = count($td); //获得课程列表 for ($i=0; $i < $length; $i++) {$td[$i] = str_replace("

", "", $td[$i]); $reg = "/{(.*)}/"; if (!preg_match_all($reg, $td[$i], $matches)) { unset($td[$i]); }}$td = array_values($td); //将课程列表数组重新索引$tdLength = count($td);for ($i=0; $i array(1,2 => \,3,4 => \,5,6 => \,7,8 => \,9,10 => \),mon => array(1,2 => \,3,4 => \,5,6 => \,7,8 => \,9,10 => \), ues => array(1,2 => \,3,4 => \,5,6 => \,7,8 => \,9,10 => \),wed => array(1,2 => \,3,4 => \,5,6 => \,7,8 => \,9,10 => \), hur => array(1,2 => \,3,4 => \,5,6 => \,7,8 => \,9,10 => \),fri => array(1,2 => \,3,4 => \,5,6 => \,7,8 => \,9,10 => \),sat => array(1,2 => \,3,4 => \,5,6 => \,7,8 => \,9,10 => \));$week = array("sun"=>"周日","mon"=>"周一","tues"=>"周二","wed"=>"周三","thur"=>"周四","fri"=>"周五","sat"=>"周六");$order = array(1,2,3,4,5,6,7,8,9,10);foreach ($table as $key => $value) {$class = $value;foreach ($week as $key => $weekDay) {$pos = strpos($class,$weekDay);// echo $pos;if ($pos) {$weekArrayDay = $key; //获取list数组中的第一维key foreach ($order as $key => $orderClass) {$pos = strpos($class,$orderClass);if ($pos) {$weekArrayOrder = $orderClass; //获取该课程是第几节break;}}break;}}$list[$weekArrayDay][$weekArrayOrder] = $class;}return $list;}//调用函数return converttoTable($td); }else{ return 0; }}

6,再试试查询空教室的功能

//空教室查询结果public function roomresult(){$xh = ""; //设置学号$pwd = ""; //学号对应的密码$cookie = $this->login($xh,$pwd); $url = "http://jw./xs_main.aspx?xh={$xh}"; $result = curl_request($url,\,$cookie); //保存的cookies $url="http://jw./xxjsjy.aspx?xh={$xh}"; $post[Button2] = iconv(utf-8, gb2312, 空教室查询); $post[\__EVENTARGUMENT]=\; $post[\__EVENTTARGET]=\; $post[\__VIEWSTATE] = $this->getViewJs($cookie,$xh); $post[ddlDsz] = iconv(utf-8, gb2312, 单); $post[ddlSyXn] = -; //学年 $post[ddlSyxq] = 1; $post[jslb] = \; $post[xiaoq] = \; $post[kssj]=$_GET[start]; //提交的开始查询时间$post[sjd]=$_GET[class];//提交的课程节次 $post[xn]=-;//所在学年 $post[xq]=2;//所在学期 $post[xqj]=6;//当天星期几 $post[dpDataGrid1:txtPageSize]=90;//每页显示条数 $result = curl_request($url,$post,$cookie,0);preg_match_all(/]+>[^>]+span>/,$result,$out); $tip = iconv(gb2312, utf-8, $out[0][3]);//获取页面前部的提示内容 preg_match_all(/

([\w\W]*?)/,$result,$out); $table = iconv(gb2312, utf-8, $out[0][0]); //获取查询列表$this->load->view("classroom",array( ip=>$tip, able=>$table)); }

总结起来就是这些了,每个学校的教务系统都不尽相同,这时我们可以借助火狐浏览器的 firebug 抓包,看看到底提交了哪些东西。如果不成功,要看看自己该提交的东西post 上去了没有,如果再不成功,额……可以联系我 imzhongshan@

就这些了,赶快去试试吧!

以上就介绍了以正方教务系统为例,用php模拟登陆抓取课表、空教室,包括了方面的内容,希望对PHP教学有兴趣的朋友有所帮助。

如果觉得《以正方教务系统为例 用php模拟登陆抓取课表 空教室》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。