Python3 urllib 爬取 花瓣网图片
点我去我的github上看源码 **花瓣网是动态的,所以要抓包分析,,但我真的累的不行,不想写教程了,我源码里有注释
点我去我的github上看源码 **花瓣网是动态的,所以要抓包分析,,但我真的累的不行,不想写教程了,我源码里有注释
点我去我的github上看源码 简单使用静态方法爬取https://wallhalla.com/网站的图片 参考: https://blog.csdn.net/cquptcmj/article/details/53526137 https://www.cnblogs.com/zhouxuchen/p/4341034.html
https://blog.csdn.net/caimouse/article/details/77647952 下载地址:http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载到文件:Twisted-18.7.0-cp35-cp35m-win_amd64.whl 然后安装:pip install Twisted-18.7.0-cp35-cp35m-win_amd64.whl 如果不行 下载win32版本试试 如果不行 提示Python.h: No such file or directory compilation terminated. 那么就 sudo apt-get install python-dev 然后试试 上面步骤 如果还不行 sudo pip3 install twisted
以下maven配置能正确读取hive. 不该加的不要加. spark版本用cdh的. <properties> <maven.compiler.source>8</maven.compiler.source> <maven.compiler.target>8</maven.compiler.target> <spark.version>2.4.0-cdh6.3.2</spark.version> <hive.version>2.1.1-cdh6.3.2</hive.version> </properties> <dependencies> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-sql_2.11</artifactId> <version>${spark.version}</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.11</artifactId> <version>${spark.version}</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-hive_2.11</artifactId> <version>${spark.version}</version> <exclusions> <exclusion> <artifactId>hive-metastore</artifactId> <groupId>org.spark-project.hive</groupId> </exclusion> <exclusion> <artifactId>hive-exec</artifactId> <groupId>org.spark-project.hive</groupId> </exclusion> </exclusions> </dependency> <!-- <dependency>--> <!-- <groupId>org.apache.hive</groupId>--> <!-- <artifactId>hive-metastore</artifactId>--> <!-- <version>${hive.version}</version>--> <!-- </dependency>--> <dependency> <groupId>org.apache.hive</groupId> <artifactId>hive-exec</artifactId> <version>${hive.version}</version> <exclusions> <exclusion> <groupId>*</groupId> <artifactId>*</artifactId> </exclusion> </exclusions> </dependency> </dependencies>
问题版本: Spark:2.14.0 Hive:2.1.0 原因参见spark hive java.lang.NoSuchFieldError: HIVE_STATS_JDBC_TIMEOUT 解决方案: 使用 cdh版本的包,比如 <spark.version>2.4.0-cdh6.3.2</spark.version> <hive.version>2.1.1-cdh6.3.2</hive.version> 如果遇到有关 apache的log4j包缺失,加入 <dependency> <groupId>org.apache.logging.log4j</groupId> <artifactId>log4j-core</artifactId> <version>2.8.2</version> </dependency> 注意版本 相关问题参见I’m getting “NoClassDefFoundError: org/apache/logging/log4j/util/ReflectionUtil” 掰掰
先ctrl+`安装packa: import urllib.request,os; pf = ‘Package Control.sublime-package’; ipp = sublime.installed_packages_path(); urllib.request.install_opener( urllib.request.build_opener( urllib.request.ProxyHandler()) ); open(os.path.join(ipp, pf), ‘wb’).write(urllib.request.urlopen( ‘http://sublime.wbond.net/' + pf.replace(’ ‘,’%20’)).read()) 使用快捷键ctrl+shift+p,输入packet control install package 这个网站上可以自制主题 http://tmtheme-editor.herokuapp.com/#!/editor/local/undefined 之后将文件放到home/peng/.config/sublime-text-3/Packages 从preferences里的theme选项可以换了
1. docker 安装 参考 sudo apt-get update sudo dpkg --configure -a sudo apt-get install apt-transport-https ca-certificates curl software-properties-common curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add - sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" sudo apt-get update sudo apt-get install docker-ce 1.5 docker换源(可选) 参考 2. docker验证 docker --version sudo docker run hello-world 3. docker非root使用 参考 sudo usermod -aG docker $USER sudo service docker restart newgrp docker 4. hadoop的docker image 参考:基于Docker搭建Hadoop集群之升级版...
例题6-21 系统依赖(System Dependencies, ACM/ICPC World Finals 1997, UVa506) 软件组件之间可能会有依赖关系,例如,TELNET和FTP都依赖于TCP/IP。你的任务是 模拟安装和卸载软件组件的过程。首先是一些DEPEND指令,说明软件之间的依赖关系(保 证不存在循环依赖),然后是一些INSTALL、REMOVE和LIST指令,如表6-1所示。 表6-1 指令说明 指令 说明 DEPEND item1 item2 [item3 …] item1依赖组件item2, item3, … INSTALL item1 安装item1和它的依赖(已安装过的不用重新安装) REMOVE item1 卸载item1和它的依赖(如果某组件还被其他显式安装的组件所依赖,则不能卸载这个组件) LIST 输出所有已安装组件 在INSTALL指令中提到的组件称为显式安装,这些组件必须用REMOVE指令显式删除。 同样地,被这些显式安装组件所直接或间接依赖的其他组件也不能在REMOVE指令中删除。 每行指令包含不超过80个字符,所有组件名称都是大小写敏感的。指令名称均为大写字母。 Sample Input DEPEND TELNET TCPIP NETCARD DEPEND TCPIP NETCARD DEPEND DNS TCPIP NETCARD DEPEND BROWSER TCPIP HTML INSTALL NETCARD INSTALL TELNET INSTALL foo REMOVE NETCARD INSTALL BROWSER INSTALL DNS LIST REMOVE TELNET REMOVE NETCARD REMOVE DNS...
https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&category=829&problem=1023&mosmsg=Submission+received+with+ID+20388214 A common typing error is to place the hands on the keyboard one row to the right of the correct position. So ‘Q’ is typed as ‘W’ and ‘J’ is typed as ‘K’ and so on. You are to decode a message typed in this manner. Input Input consists of several lines of text. Each line may contain digits, spaces, upper case letters (except Q, A, Z), or punctuation shown above [except back-quote (‘)]....
例题6-16 单词(Play On Words, UVa 10129) 输入n(n≤100000)个单词,是否可以把所有这些单词排成一个序列,使得每个单词的 第一个字母和上一个单词的最后一个字母相同(例如acm、malform、mouse)。每个单词最多包含1000个小写字母。输入中可以有重复单词。 Sample Input 3 2 acm ibm 3 acm malform mouse 2 ok ok Sample Output The door cannot be opened. Ordering is possible. The door cannot be opened. 本家链接 将一个单词看做是首字母到尾字母的一条路,所以这条路我们只关心头尾,即首尾两个字母,不关心中间字母。 所以我们可以构造一个图,26*26的图,有向的。其中的边即是一个单词。由此我们便无需关心重复以及首尾字母相同的具体单词了,只关心具有同样首尾的单词的数量。 所以这道题就成为了:构造了一个图,是否存在欧拉回路。 存在欧拉回路条件: 图连通 除了起点和终点,其余每个点的出入度都必须一样。 起点和终点的出入度之差为0或各为1。 用dfs判断连通,用数组记录各个点的出入度。 #include<iostream> #include<string> #include<cstring> using namespace std; /* x --> y */ int dict[33][33]; int inDegree[33]; int outDegree[33]; int N; int SUM = 26; int dfs(int w){ /* start at w */ int road = 0; for(int i=0;i<SUM;i++){ /* 找到了对应的尾字母,即存在一个单词,一条路 */ if(dict[w][i]==1){ dict[w][i] = 2; /* 走过了 */ road = 1; /* 路标记 */ dfs(i); /* 找下一个 */ } return road; } int main(){ int T; cin>>T; while(T--){ cin>>N; int n=N; memset(dict,0,sizeof(dict)); memset(inDegree,0,sizeof(inDegree)); memset(outDegree,0,sizeof(outDegree)); string s; while(n--){ cin>>s; int x = s[0]-'a'; int y = s[s....
两格子之间的距离 http://acm.hdu.edu.cn/showproblem.php?pid=1030 走一步判断一下 下一步走哪里 是走下面呢(前提要能走) 还是走左边 还是走右边 设定一个格子,代表当前走到的地方 如果能直接向下走,就向下走 不能的话: 如果终点在当前格子的哪一边(只看左右方向,不看上下),就走哪一边 #include<iostream> #include<cmath> using namespace std; // 同一行 相邻的能通过 // 上下行 上行的第奇数个能和下行中第偶数个过 //1 3 5 7 //1 2*1-1 2*n-1 //(1+ 2*n-1)*n/2 = int(a) //第 sqrt(a) +1 行 //第 a - sqrt(a)^2 个 // 向左走,向右走? int which(int a){ int n = sqrt(a-1); int ge = a-n*n; n ++; return n; } int getmid(int a){ int n = which(a); return pow(n-1,2) + n; } int main(){ int a,b; while(cin>>a>>b){ if(a>b) a^=b^=a^=b; int go = a; int b_n = which(b);// 行 int b_mid = getmid(b); int go_mid; int go_n; int sum = 0; while(go !...
例题6-15 给任务排序(Ordering Tasks, UVa 10305) 假设有n个变量,还有m个二元组(u, v),分别表示变量u小于v。那么,所有变量从小到 大排列起来应该是什么样子的呢?例如,有4个变量a, b, c, d,若已知a < b,c < b,d < c,则 这4个变量的排序可能是a < d < c < b。尽管还有其他可能(如d < a < c < b),你只需找出其 中一个即可。 Sample Input 5 4 1 2 2 3 1 3 1 5 0 0 Sample Output 1 4 2 5 3 本家连接 dfs(n) 从n开始找上级 循环找上级 如果没有上级,break 如果有上级, if 上级 is execute: continue else if 上级 not execute. then dfs(上级),...
习题3-9 子序列(All in All, UVa 10340) 输入两个字符串s和t,判断是否可以从t中删除0个或多个字符(其他字符顺序不变), 得到字符串s。例如,abcde可以得到bce,但无法得到dc。 Sample Input sequence subsequence person compression VERDI vivaVittorioEmanueleReDiItalia caseDoesMatter CaseDoesMatter Sample Output Yes No Yes No https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&category=830&problem=1281&mosmsg=Submission+received+with+ID+20551262 循环大的 从第一位小的开始 判断是否匹配,若是小的下标+1,若非大的+1,继续循环。 #include<iostream> #include<string> using namespace std; int main() { string s,a; while(cin>>s>>a) { int sn=0; for(int i=0;i<a.size()&&sn<s.size();i++) { if(a[i]==s[sn]) { sn++; //cout<<sn<<"!!"<<endl; } } if(sn==s.size()) cout<<"Yes"<<endl; else cout<<"No"<<endl; } return 0; } //AC at 2017/12/30 (没想到居然一下就过了,总共十分钟?这还是在同一天的)
例题6-17 看图写树(Undraw the Trees, UVa 10562) 你的任务是将多叉树转化为括号表示法。如图6-16所示,每个结点用除了“-”、“|”和空格 的其他字符表示,每个非叶结点的正下方总会有一个“|”字符,然后下方是一排“-”字符,恰 好覆盖所有子结点的上方。单独的一行“#”为数据结束标记。 Sample Input 2 A | -------- B C D | | ----- - E F G # e | ---- f g # Sample Output (A(B()C(E()F())D(G()))) (e(f()g())) 本家地址 先记录树,然后从头开始递归遍历树,并且构造先序遍历字串。 非叶子结点字母下方必有竖线。竖线下方必有若干横线,横线下方必有若干字母,即子节点。 #include<iostream> #include<string> #include<cstdio> #include<cstring> using namespace std; char tree[222][222]; int isRightChar(char c){ return c && c!='-' && c!='|' && c!=' ' && c!='#'; } int loop(int x,int y){ cout<<tree[x][y]; cout<<"("; if(tree[x+1][y]!...
习题3-12 浮点数(Floating-Point Numbers, UVa11809) 计算机常用阶码-尾数的方法保存浮点数。如图3-9所示,如果阶码有6位,尾数有8位,可以表达的最大浮点数为0.1111111112×2 1111112。注意小数点后第一位必须为1,所以一共有9位小数。 图3-9 阶码-尾数保存浮点数 这个数换算成十进制之后就是0.9980468752^63=9.20535763834529410^18。你的任务是根据这个最大浮点数,求出阶码的位数E和尾数的位数M。输入格式为AeB,表示最大浮点数为A*10B。0< A<10,并且恰好包含15位有效数字。输 入结束标志为0e0。对于每组数据,输 出M和E。输入保证有唯一解,且0≤M≤9,1≤E≤30。在本题中,M+E+2不必为8的整数倍。 Sample Input 5.699141892149156e76 9.205357638345294e18 0e0 Sample Output 5 8 8 6 https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&category=830&problem=2909&mosmsg=Submission+received+with+ID+20702100 我们只要算:m*2^(2^n-1)=f *10^t (m是浮点数位,n是阶码位数,求f和t;) 而f=10^log10(f):即左边=10^t1=10^(t+log10(f)); t1=log10(m*2^(2^n-1))=log10(m)+(2^n-1) *log10(2) t=(int)t1; f=10^(t1-t); 感谢参考来自http://blog.csdn.net/crazysillynerd/article/details/43339157 #include<iostream> #include<cstdio> #include<cmath> using namespace std; double flo[10][30]; int expstr[10][30]; int main() { int twoe; double twom; double temp; for(int i=0;i<10;i++) { twom=1-pow(2,-i-1); for(int j=0;j<30;j++) { twoe = pow(2,j+1)-1; temp = log10(twom)+twoe*log10(2); expstr[i][j]=temp; flo[i][j]=pow(10,(temp-expstr[i][j])); } } while(1) { double flo1; int exp1; char str[25]={0};//存输入的浮点数字符串 int iff=0; //输入浮点数 char c; for(int i=0;(c=getchar())!...
例题6-22 战场(Paintball, UVa 11853) 有一个1000×1000的正方形战场,战场西南角的坐标为(0,0),西北角的坐标为(0,1000)。 战场上有n(0≤n≤1000)个敌人,第i个敌人的坐标为(xi ,yi ),攻击范围为ri。为了避开敌人的 攻击,在任意时刻,你与每个敌人的距离都必须严格大于它的攻击范围。你的任务是从战场 的西边(x=0的某个点)进入,东边(x=1000的某个点)离开。如果有多个位置可以进/出, 你应当求出最靠北的位置。输入每个敌人的xi、yi、ri,输出进入战场和离开战场的坐标。 Sample Input 3 500 500 499 0 0 999 1000 1000 200 Sample Output 0.00 1000.00 1000.00 800.00 本家地址 关键在于抓住问题的本质,即问题的核心,即问题去除了表面保护层之下的那个最纯粹的那个命脉。 初看,我们发现,这是要在坐标图上画圆啊。过分可怕。 但是我们鼓起勇气再细看问题: 求最靠上的进入战场和离开战场的坐标。 解剖一下: 能否离开 若能,最上 最左边进,最后边出。 然后我们随便画几个图来看看。 怎么样就不能离开: 当有一条敌人从最上一直连通到最下。 若能,最靠上的地方是哪里: 如果我们最左边进入的地方的下方有一条敌线一直连通到最上边。 那么这条敌线就把我们包住了。 所以 敌线(从上方延伸 and 延伸到左边),就不能被我们在其上方进入。 所以我们只要求敌线的连通性和敌线范围(从上方开始的)在最左边和最右边的最下方坐标即可。 #include<iostream> #include<map> #include<cmath> #include<cstring> #include<vector> #include<queue> #include<cstdio> using namespace std; /* 关键在于抓住问题的本质,即问题的核心,即问题去除了表面保护层之下的那个最纯粹的那个命脉。 初看,我们发现,这是要在坐标图上画圆啊。过分可怕。 但是我们鼓起勇气再细看问题: 求最靠上的进入战场和离开战场的坐标。 解剖一下: 1. 能否离开 2. 若能,最上 3....
例题5-5 集合栈计算机(The Set Stack Computer,ACM/ICPC NWERC 2006,UVa12096) 有一个专门为了集合运算而设计的“集合栈”计算机。该机器有一个初始为空的栈,并且 支持以下操作。 PUSH:空集“{}”入栈。 DUP:把当前栈顶元素复制一份后再入栈。 UNION:出栈两个集合,然后把二者的并集入栈。 INTERSECT:出栈两个集合,然后把二者的交集入栈。ADD:出栈两个集合,然后把先出栈的集合加入到后出栈的集合中,把结果入栈。 每次操作后,输出栈顶集合的大小(即元素个数)。例如,栈顶元素是A={{}, {{}}},下一个元素是B={{},{{{}}}},则: UNION操作将得到{{},{{}},{{{}}}},输出3。 INTERSECT操作将得到{{}},输出1。 ADD操作将得到{{},{{{}}},{{},{{}}}},输出3。 输入不超过2000个操作,并且保证操作均能顺利进行(不需要对空栈执行出栈操作)。 Sample Input 2 9 PUSH DUP ADD PUSH ADD DUP ADD DUP UNION 5 PUSH PUSH ADD PUSH INTERSECT Sample Output 0 0 1 0 1 1 2 2 2 *** 0 0 1 0 0 *** https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&category=835&problem=3248&mosmsg=Submission+received+with+ID+21273791 性质: 1、set< int > 代表是集合 2、idcache 是集合与其编号的映射,每一个集合都有唯一的编号。 3、setcache是向量,即下标与其存的是集合的元素相映射。 4、每一个集合都只在以上容器中存在一个。 5、栈里存的只是集合的编号。 #include <iostream> #include <set> #include <map> #include <stack> #include <vector> using namespace std; map< set<int> ,int> idcache; //每一个集合对应一个编号 vector< set<int> > setcache; //每一个编号对应一个集合 int getid(set<int> s) { if(idcache....
例题6-18 雕塑(Sculpture, ACM/ICPC NWERC 2008, UVa12171) 某雕塑由n(n≤50)个边平行于坐标轴的长方体组成。每个长方体用6个整 数x0,y0,z0,x,y,z表示(均为1~500的整数),其中x0为长方体的顶点中x坐标的最小 值,x表示长方体在x方向的总长度。其他4个值类似定义。你的任务是统计这个雕像的体积 和表面积。注意,雕塑内部可能会有密闭的空间,其体积应计算在总体积中,但从“外部”看 不见的面不应计入表面积。雕塑可能会由多个连通块组成。 Sample Input 2 2 1 2 3 3 4 5 6 2 3 3 4 5 7 1 1 1 5 5 1 1 1 10 5 5 1 1 1 2 1 4 8 2 1 2 4 1 8 5 2 2 1 4 8 1 5 2 4 1 8 3 3 4 1 1 1...
例题6-7 树的层次遍历(Trees on the level, Duke 1993, UVa 122) 输入一棵二叉树,你的任务是按从上到下、从左到右的顺序输出各个结点的值。每个结 点都按照从根结点到它的移动序列给出(L表示左,R表示右)。在输入中,每个结点的左 括号和右括号之间没有空格,相邻结点之间用一个空格隔开。每棵树的输入用一对空括 号“()”结束(这对括号本身不代表一个结点),如图6-3所示。 图6-3 一棵二叉树 注意,如果从根到某个叶结点的路径上有的结点没有在输入中给出,或者给出超过一 次,应当输出-1。结点个数不超过256。 样例输入: (11,LL) (7,LLL) (8,R) (5,) (4,L) (13,RL) (2,LLR) (1,RRR) (4,RR) () (3,L) (4,R) () 样例输出: 5 4 8 11 13 4 7 2 1 not complete 本家地址 祭出对象大法 #include<iostream> #include<sstream> #include<string> #include<cstring> #include<cstdio> #include<cstdlib> using namespace std; class Node{ public: int value; Node* left; Node* right; }; Node* queue[256]; void show(Node* root){ memset(queue,0,sizeof(queue)); int qbegin=0; int qend=0; int qlen = sizeof(queue)/sizeof(Node*); stringstream out; queue[qend] = root; qend = (qend+1) % qlen; while(qbegin!...
把前n(n≤10000)个整数顺次写在一起:123456789101112…数一数0~9各出现多少次 (输出10个整数,分别是0,1,…,9出现的次数)。 Sample Input 2 3 13 Sample Output 0 1 1 1 0 0 0 0 0 0 1 6 2 2 1 1 1 1 1 1 (注:输出的最后一个数后面没有空格) https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&category=830&problem=3666&mosmsg=Submission+received+with+ID+20469369 //判断一个数各个位的数字,存于一个数组中,倒的来循环也无妨 #include<iostream> #include<cstdio> using namespace std; int main() { int T; cin>>T; getchar(); while(T--) { int num[10]={0}; int N; cin>>N; getchar(); while(N--) { int ni=N+1; while(ni) { num[ni%10]++; ni/=10; } } for(int i=0;i<9;i++) cout<<num[i]<<" "; cout<<num[9]<<endl; } return 0; } //AC at 2017/12/10