缘起
这段时间给朋友搞了个群发邮件的脚本,为了防止进入垃圾邮件,做了很多工作,刚搞完,垃圾邮件进入率50%,觉得还不错,如果要将垃圾邮件的进入率再调低,估计就要花钱买主机了,想想也就算了,先发一个月,看看效果再拓展吧。
脚本主要是通过Python写的,调的smtplib库,这些是基础,大家在网上一搜一大堆,今天主要给大家讲解下如何避免进入垃圾邮件系统,以及整个系统搭建时的一些思想。可能刚搞Python不久,有很多可能是错误的写法望大家提出来哈~
配置
CentOS7.0系统
Python 3.4
CentOS7.0下面默认的是Python2.7.5,我们先来将Python的版本提升上去
#wget https://www.python.org/ftp/python/3.4.3/Python-3.4.3.tgz
下载Python3.4版本
#tar -xf Python-3.4.3.tgz #cd Python-3.4.3/ #./configure
这边configure的时候可能会遇到你的环境没有安装gcc编译环境,执行下面的语句再configure即可
#yum -y install gcc #yum -y install gdb #yum -y install gcc-c++
编译安装
#make #make install
因为替换了python版本之后yum可能不能正常使用,需改两个文件
#vim /usr/bin/yum #vim /usr/libexec/urlgrabber-ext-down
将这两个文件的头部的#!/usr/bin/python改成#!/usr/bin/python2.7即可,保存退出,yum满状态复活
编译完了之后,将python3.4设置为默认python解析。
#ln -s /usr/local/bin/python3.4 /usr/bin/python
链接完成之后检查python版本
#python -V
出现Python3.4就标识版本切换完成
系统架构
Account:用于存放发送者邮箱账号的目录,我的163邮箱,sina邮箱,sohu邮箱和tom邮箱均在淘宝上购买了30个可以发送smtp服务的账号,花费一顿饭的钱不到就可以搞到啦~账号密码用【:】分割,每个账号之间使用【,】分割。
Common:引用类文件夹,里面是日至系统配置文件和日志系统源代码
Conf:全局配置文件,目前还木有用到
Image:邮件发送过程中需要使用到的图片资源
Log:日志文件,按日期区分
Logbackups:日志备份文件,用于备份过期日志
Sendmail:用于存储收件人的邮箱信息,账号之间用【,】分割
mail_html.py:主要执行脚本
README.md:git版本控制用户须知,我是通过码云来管理我的代码的
日志系统
提起脚本系统,日志是相当关键的一个角色,尤其是当你的脚本出错,你要查错的时候,就非常重要了,我也是从网上搞来的一段Log日志系统的代码,觉得挺好用,供大伙参考~
主要思想是,打印log到指定文件,打印log到屏幕,啥也不说了,先上代码,因为是网上的代码,我就放上来啦~
# coding: utf-8 #from lxml import etree import logging.handlers import logging import os import sys import time import datetime try: import xml.etree.cElementTree as ET except ImportError: import xml.etree.ElementTree as ET # 提供日志功能 class logger: # 先读取XML文件中的配置数据 # 由于config.xml放置在与当前文件相同的目录下,因此通过 __file__ 来获取XML文件的目录,然后再拼接成绝对路径 # 这里利用了lxml库来解析XML root = ET.parse(os.path.join(os.path.dirname(__file__), 'config.xml')).getroot() # 读取日志文件保存路径 logpath = root.find('logpath').text # 读取日志文件容量,转换为字节 logsize = 1024*1024*int(root.find('logsize').text) # 读取日志文件保存个数 lognum = int(root.find('lognum').text) # 添加分天日志名 now = datetime.datetime.now() now_time = now.strftime('%Y%m%d') log_file_name = sys.argv[0].split('/')[-1].split('.')[0] + '_' + now_time # 日志文件名:由用例脚本的名称,结合日志保存路径,得到日志文件的绝对路径 logname = os.path.join(logpath, log_file_name) # 初始化logger log = logging.getLogger() # 日志格式,可以根据需要设置 fmt = logging.Formatter('[%(asctime)s][%(filename)s][line:%(lineno)d][%(levelname)s] %(message)s', '%Y-%m-%d %H:%M:%S') # 日志输出到文件,这里用到了上面获取的日志名称,大小,保存个数 handle1 = logging.handlers.RotatingFileHandler(logname, maxBytes=logsize, backupCount=lognum) handle1.setFormatter(fmt) # 同时输出到屏幕,便于实施观察 handle2 = logging.StreamHandler(stream=sys.stdout) handle2.setFormatter(fmt) log.addHandler(handle1) log.addHandler(handle2) # 设置日志基本,这里设置为INFO,表示只有INFO级别及以上的会打印 log.setLevel(logging.INFO) # 日志接口,用户只需调用这里的接口即可,这里只定位了INFO, WARNING, ERROR三个级别的日志,可根据需要定义更多接口 @classmethod def info(cls, msg): cls.log.info(msg) return @classmethod def warning(cls, msg): cls.log.warning(msg) return @classmethod def error(cls, msg): cls.log.error(msg) return
日志系统的配置文件
<?xml version="1.0" encoding="utf-8"?> <config> <!-- 日志保存路径 --> <logpath>/Users/litao/Desktop/mail_html/Log</logpath> <!-- 每个脚本对应的日志文件大小,单位MB --> <logsize>8</logsize> <!-- 每个脚本保存的日志文件个数 --> <lognum>100</lognum> </config>
保存的路径各位随意哈。
如何使用
logger.info('邮件总数量【'+str(len(recivers))+'】') logger.info('总计发送邮件数量【'+str(send_num)+'】') logger.info('总计发送错误数量【'+str(error_num)+'】') logger.info('成功邮箱账号集合:'+','.join(send_success_account)) logger.info('失败邮箱账号集合:'+','.join(send_failure_account)) logger.info('脚本结束------------------------------------------------------------------') logger.info('')
error的话将info换成error即可
执行主文件
提起垃圾邮件,大家首先想到的就是那个令人讨厌的垃圾箱里面的营销邮件,但是,如果你的邮件内容写的很棒,是不是就可以避免被封杀,答案是否定的,邮件被封杀是机器干的,如果是机器干的事,那就好办了,首先,我们得先知道机器的工作原理。
大部分被列为垃圾邮件的邮件均有两个特征:内容不变,IP不变,其实做到内容一直变,IP一直变理论上就可以做到不进垃圾邮箱,但是哪有那么多的人力物力做这事,所以,我们要做的是解决概率性的问题。
内容混淆
内容不变我们可以使用多套模板,嵌套着发,这个问题好解决,但是IP不变,这个就难一点了,其实我也没解决,主要是怕花钱,我能做的就是通过多套模板来实现内容概率性的不被封杀。
好了,我们先准备30个邮件的subject,30套邮件的内容模板,下面就是我的全局subject配置
这样做的好处就是可以防止邮件的内容被封杀,假设我们30秒发一封邮件,那么在20分钟内的邮件,没有一封是重复的。我们是从接受邮箱域名的角度考虑的,也就是如果我们的营销对象全是QQ邮箱,那么QQ邮箱的邮箱服务器在20分钟内收到同一IP的邮件内容是不一样的,这很大程度上就能避免被封杀。
账户混淆
设置这么多账号是干嘛用的呢,主要还是想混淆机器,让垃圾邮件进率更低。
下面我个人经过测试,发现邮箱服务器具有的一些特性。
163邮箱
163邮箱设置了每天每个账号邮件发送的上限位50封,账号554出错重发的时间是3小时。
tom邮箱
tom邮箱每天邮件发送数量不做限制,我们也假设是50封,但是每封邮件之间的发送间隔一定要超过30秒,要不然会被短时间连接数过大报错。
sohu邮箱
业界良心,基本上没出过啥错误,一直保持着良好的发送成功率。我们也将其定位发送间隔30秒,每日上线50封。
sina邮箱
恶心的玩意儿,每次发送邮箱前需要先登录,认证手机号,每个手机号5个邮箱哈,但是效果显著,认证完毕,和sohu一样,基本没出错过。
时间混淆
有了这些基础,我们就可以知道了,我们有120个账号,30个邮件模板,每天一刻不停的发送,每封邮件之间的间隔为30秒,一天的邮件发送量在2800封左右。
我觉得一天2800封,如果有钱的话,一台ESC的费用是3元每天,独立ip哈,如果找第三方发送,一封邮件是3分钱,量大2分钱,他们是EDM的,我测试过1500封,达到率不足千分之一。也就是说,我们发送1500封,只需要1块多钱,找第三方发送,1500封怎么也得40块钱。成本是不是很低。
好的,那就来看看邮件是如何发送的吧。
邮件发送
下面我们来看下我的主文件是如何搞的
#coding=utf-8 import smtplib import mimetypes import time import datetime from email.mime.text import MIMEText from email.mime.multipart import MIMEMultipart from email.mime.image import MIMEImage #引入外部文件 from Common.log import *
导入模块,以来的外部库和内部的文件
#目录主位置
_root_dir = '/Users/litao/Desktop/mail_html/'
_title_common = '愚人节'
愚人节主题礼物,也是为了以后省事,subject和内容中设计到title的均会被改为愚人节,马上愚人节了吗,营销方式,代码实现,异常方便修改。
#邮箱内容设置 _content = """ <html> <style> .title{font-weight:bold;font-size:18px;}</style> <body> <p> <img src="cid:image1"> <br><br> <span class="title">【愚人节】将至,您还没准备礼物?那你一定会过个开心的愚人节的</span> <br> 愚人节就要来啦,礼朵朵给大伙准备了大批量的礼物伴你度过愚人节,具体百度一下【礼朵朵】,赶紧进站选礼物吧~ <br> 选礼物前别忘了先去心愿墙许愿哟,你的愿望可能被礼朵朵看到,可以帮你实现哟,实现的时候别忘了来礼朵朵还愿哈~ <br><br> <span class="title">【礼朵朵】介绍</span> <br> 国人从古至今都有送礼的习俗,送礼作为传统之一,一直流传至今,礼尚往来成为人生必修课。 <br> 【礼朵朵】集合商业送礼和现代送礼搭建礼物导购分享平台【朵朵礼物】,带给老少皆宜的送礼分享体验新体验。 <br> 与此同时,礼朵朵还给大伙准备了礼物攻略【礼物说】,让大家可以对礼物有个更全面的了解~ <br><br> <span class="title">百度搜索【礼朵朵】,开启你的礼物新旅程吧~</span> <br><br> </p> </body> </html> """
营销内容模板,html模式实现邮件的发送,少不了有模板~
#发送邮箱smtp地址 _smtp_address = ['smtp.163.com','smtp.sina.cn','smtp.tom.com','smtp.sohu.com']
smtp地址数组,用于在不同的邮件服务器间切换。
def sendMail(sender,reciver,subject,content,passwd,smtpadd): username=sender password=passwd msg=MIMEMultipart('related') msg['Subject']=subject #html格式 html=content htm = MIMEText(html,'html','utf-8') msg.attach(htm) #构造图片 fp=open(_root_dir+'Image/logo_small.png','rb') msgImage=MIMEImage(fp.read()) fp.close() msgImage.add_header("Content-ID", "<image1>") msg.attach(msgImage) fp2=open(_root_dir+'Image/yurenjie.png','rb') msgImage2=MIMEImage(fp2.read()) fp2.close() msgImage2.add_header('Content-Disposition', 'attachment', filename="愚人节活动海报.jpg") msg.attach(msgImage2) msg['From']=sender msg['To']=reciver #发送邮件 smtp=smtplib.SMTP() smtp.connect(smtpadd) smtp.login(username, password) smtp.sendmail(sender, reciver, msg.as_string()) smtp.quit()
发邮件方法,里面有两个地方需要注意,一个是
msgImage.add_header("Content-ID", "<image1>") msg.attach(msgImage)
将邮件模板中的image1的img标签内容替换成我们想要的图片
第二个
fp2=open(_root_dir+'Image/yurenjie.png','rb') msgImage2=MIMEImage(fp2.read()) fp2.close() msgImage2.add_header('Content-Disposition', 'attachment', filename="愚人节活动海报.jpg")
插入附件,图片是一个海报,说起海报,强烈建议大家使用创客贴这个平台,非常好用。
下面就是发送邮件啦!!!
#发送邮件 smtp=smtplib.SMTP() smtp.connect(smtpadd) smtp.login(username, password) smtp.sendmail(sender, reciver, msg.as_string()) smtp.quit()
通用方法,将文件中的以,分割的内容以数组形式返回
#读取文件中的数据,并将使用,分割的数据变为数组 def readFileToSplit(filepath): file_stream = open(filepath) try: data = file_stream.read() finally: file_stream.close() data_split = data.split(',') return data_split
主方法
1、切割账号
2、切换邮件服务器
3、每发送一封邮件,休息25秒,切换账号,继续发送
4、日志记录
5、错误处理
if __name__=="__main__": content=_content # 接收人的邮箱按照每天2000封来,每天的邮箱都需要更换,文件名最后以日期为准,邮件发送量以日志为准 recivers=readFileToSplit(_root_dir+'Sendmail/mail_test.txt') # 把4个邮箱的账号都获取到,方便下面for循环中使用 account_163=readFileToSplit(_root_dir+'Account/account163') account_sina=readFileToSplit(_root_dir+'Account/accountsina') account_tom = readFileToSplit(_root_dir+'Account/accounttom') account_sohu = readFileToSplit(_root_dir+'Account/accountsohu') # 获取邮件发送模板 # 注意模板之间的切换 #log_file_stream = open(_root_dir+'log', 'w+') logger.info('') logger.info('脚本开始------------------------------------------------------------------') # 统计邮件发送量 send_num = 0 # 统计发送出错量 error_num = 0 # 统计发送失败的邮箱发送账号 send_success_account = [] # 统计发送成功的邮箱发送账号 send_failure_account = [] subject_num = len(_subject) # 最后统计没有发出去的邮箱号,放到下日,继续发送 for i in range(0, len(recivers)): try: sendindex = i - error_num num = i % 30 account = account_163[num].split(':') addindex=i%4 subjectindex = sendindex%subject_num if addindex == 1: account=account_sina[num].split(':') elif addindex == 2: account=account_tom[num].split(':') elif addindex == 3: account=account_sohu[num].split(':') sender=account[0] passwd=account[1] smtpadd = _smtp_address[addindex] #smtpstr=str('163') sendMail(sender, recivers[sendindex], _subject[subjectindex], content, passwd, smtpadd) #print('发送账号', sender, '正在发送') str_success_1 = '发送账号【'+sender+'】正在发送' logger.info(str_success_1) #writeLog(log_file_stream,str_success_1) #print('接收序号', i, recivers[i],'发送成功') str_success_2 = '接受序号【'+str(i)+'】【'+recivers[sendindex]+'】发送成功' #writeLog(log_file_stream,str_success_2) logger.info(str_success_2) logger.info('') #print('') send_num+=1 send_success_account.append(sender) time.sleep(25) except Exception as e: #print('停止于:', i, recivers[i],',发送失败') str_failure_1 = '产生错误于:【'+sender+'】发送失败' #writeLog(log_file_stream,str_failure_1) logger.error(str_failure_1) #print(e) str_failure_2 = str(e) #writeLog(log_file_stream,str_failure_2) logger.error(str_failure_2) logger.info('') error_num+=1 send_failure_account.append(sender) #print('') #break #print('安全抵达底部') #writeLog(log_file_stream,'脚本结束') set(send_success_account) set(send_failure_account) logger.info('邮件总数量【'+str(len(recivers))+'】') logger.info('总计发送邮件数量【'+str(send_num)+'】') logger.info('总计发送错误数量【'+str(error_num)+'】') logger.info('成功邮箱账号集合:'+','.join(send_success_account)) logger.info('失败邮箱账号集合:'+','.join(send_failure_account)) logger.info('脚本结束------------------------------------------------------------------') logger.info('') #log_file_stream.close()
代码就这么多,至于subject邮件主题和模板怎么搞,可以自由发挥哈,可以放在主执行文件中,也可以放到配置文件中,实现可以配置,这里就不再赘述啦
开工
下面就可以开工啦,直接到项目主目录
#python mail_html.py
看到屏幕上有输出就OK啦,下面就是等待收获的季节
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,同时也希望多多支持毛票票!