前言: 相信很多同学学习android都开做过播放器一类的小玩意吧,但是苦于没有服务器提供数据,因而只能做个本地播放器,今天,这篇文章就是通过数据抓取,实现没有服务器,依然可以在线搜索和播放音乐!
首先,贴上我的最终实现效果:
因为数据是从虾米搜索页抓过来的,所以我把虾米logo加上去了,请大家忽略,下面来讲基本思路,首先虾米有这样一个隐藏的API:
http://www.xiami.com/song/playlist/id/
id后面接上歌曲ID就能请求的改id的歌曲信息:
如图所示:
所以,我们只需要知道歌曲ID就能获得歌曲信息了,一切都成为可能了,那么问题来了! 我们怎么获取歌曲ID呢?————没错,今天的主角登场
——Jsoup 我们用它去虾米搜索结果抓歌曲ID!
首先我们看看虾米的搜索网址:
然后我们对页面审查源代码,我们可以清楚的发现,所有搜索结果是放在一个 名为 track_list的 table中(也就是html表格中),如图所示:
我们继续往里面看:
在一个chkbox的 标签里面发现了一串数字,测试之前的我们的接口,果然是相符的,id就是它了!
接下来就是写代码了!
首先我们导入jsoup的jar包到我们的项目中 Jsoup下载地址:
Jsoup 需要添加网络权限
/** 搜索关键字地址 */ public static String KEY_SEARCH_URL = "http://www.xiami.com/search/song?key="; /** ID接口地址 */ public static String ID_SEARCH_URL = "http://www.xiami.com/song/playlist/id/"; /** * 抓取歌曲id * * @param 搜索关键词 * @param listener * 完成监听 */ public static void getIds(String input, OnLoadSearchFinishListener listener) { List<String> allIds = new ArrayList<String>(); String key = deCondeKey(input);// 解析用户输入关键字为 UTF-8 Document document = null; try { document = Jsoup.connect(KEY_SEARCH_URL + key).get();// jsoup连接最终拼接而成的请求字符串 Elements elements = document.getElementsByClass("track_list");// 选择类标签 if (elements.size() != 0) { Elements all = elements.get(0).getElementsByClass("chkbox"); int size = all.size(); for (int i = 0; i < size; i++) { String id = all.get(i).select("input").attr("value"); if (!StringUtils.isEmpty(id)) { allIds.add(id);// 不为空的话加入id list中,便于初次抓取完以后统一请求 } } if (listener != null) { if (allIds.size() == 0) { listener.onLoadFiler();// id list大小为0 说明没有获取到数据,抓取失败 } else { // 统一请求id接口地址进行再次抓取 listener.onLoadSucess(getOnlineSearchList(allIds)); } } } } catch (IOException e) { listener.onLoadFiler(); e.printStackTrace(); } }
核心逻辑解释:
首先我们用Jsoup.connect(url).get()方法获得一个document对象,然后用document对象去筛选我们先分析的那个表也就是track_list 返回一个Elements对象,我们在此筛选 chkbox,依然返回一个Elements 对象,由于歌曲有很多首,我们需要遍历一下,再选择input 标签获得我们的id
Elements elements = document.getElementsByClass("track_list");// 选择类标签 Elements all = elements.get(0).getElementsByClass("chkbox"); int size = all.size(); for (int i = 0; i < size; i++) { String id = all.get(i).select("input").attr("value"); }
上面方法就能获得我们的歌曲id,我们将它们封装在一个list中,在抓取id完成以后,我们依次取出list中的id去请求api 然后封装在一个list:中,便于在listview中展示:
Music.java实体类
import java.io.Serializable; public class Music implements Serializable { /** * */ private static final long serialVersionUID = 1L; /** 歌名 */ private String musciName; /** 歌手名 */ private String airtistName; /** 歌曲路径 */ private String path; /** 专辑名 */ private String albumName; /** 小图URL */ private String smallAlumUrl; /** 大图URL */ private String bigAlumUrl; /** 歌曲id */ private String musicId; /** 歌词地址 */ private String lrcUrl; public String getMusciName() { return musciName; } public void setMusciName(String musciName) { this.musciName = musciName; } public String getAirtistName() { return airtistName; } public void setAirtistName(String airtistName) { this.airtistName = airtistName; } public String getPath() { return path; } public void setPath(String path) { this.path = path; } public String getAlbumName() { return albumName; } public void setAlbumName(String albumName) { this.albumName = albumName; } public String getSmallAlumUrl() { return smallAlumUrl; } public void setSmallAlumUrl(String smallAlumUrl) { this.smallAlumUrl = smallAlumUrl; } public String getBigAlumUrl() { return bigAlumUrl; } public void setBigAlumUrl(String bigAlumUrl) { this.bigAlumUrl = bigAlumUrl; } public String getMusicId() { return musicId; } public void setMusicId(String musicId) { this.musicId = musicId; } public String getLrcUrl() { return lrcUrl; } public void setLrcUrl(String lrcUrl) { this.lrcUrl = lrcUrl; } }
/** * 根据id 获取歌曲数据 * * @param ids 封装id 的list * * @return 封装好的list<music> 用于listview展示 */ private static List<Music> getOnlineSearchList(List<String> ids) { List<Music> musicList = new ArrayList<Music>(); int idSize = ids.size(); for (int i = 0; i < idSize; i++) { String postUrl = ID_SEARCH_URL + ids.get(i); try { Document d = Jsoup.connect(postUrl).get();// 连接相应ID的接口地址 Elements element = d.select("trackList"); for (Element e : element) { Music music = new Music(); music.setMusicId(ids.get(i)); music.setMusciName(getSubString(e.select("title").text())); music.setAirtistName(e.select("artist").text()); music.setSmallAlumUrl(e.select("pic").text()); music.setBigAlumUrl(e.select("album_pic").text()); music.setLrcUrl(e.select("lyric").text()); music.setAlbumName(e.select("album_name").text()); // 对加密过后的歌曲在线地址进行解密 music.setPath(StringUtils.decodeMusicUrl(e.select( "location").text())); musicList.add(music);// 数据获取成功 封装入list } } catch (IOException e) { e.printStackTrace(); } } return musicList; }
这边 歌曲地址是经过加密的,我们用的时候要先解密,算法在demo里面。
在抓取完数据获得list以后,我只需写一个adpter,将数据用listview展示即可,
效果如下:
这里大功告成,在线搜索列表完成,要实现在线播放,只需要在listview点击的时候 使用 MediaPlayer.setDataSource(歌曲在线地址)即可,获得了在线地址,下载实现起来也很简单(自己写,或者借助第三方框架 xutils等均可)在这里本文主要讲核心抓取逻辑,这里就不做阐述了。
注意事项:
getIds()方法是网络访问,因此需要在子线程中调用,在主线程调用会报错,在数据获取完成以后,通过handler 再给listview设置adpter即可,具体代码大家请参考Demo.
数据抓取毕竟是拿别人网站上的数据,仅供学习使用,请不要用于任何商业用途!
有任何问题请留言或者私信!
点此Demo源码下载
<p>版权声明:本文为博主原创文章,未经博主允许不得转载。</p>