[code]
import urllib, re, sys
url = sys.argv[1]
web_source = urllib.urlopen(url).read()
1. file_or_path = re.findall('<a href="(.*?)"', web_source)
2. for i in file_or_path:
3. links = url+'/'+i.replace("/", "")
print links
[Output]
http://url.com/file_or_path
http://url.com/file_or_path
http://url.com/file_or_path
http://url.com/file_or_path
http://url.com/file_or_path
http://url.com/file_or_path
[อธิบาย]
1.ค้นหา String ระหว่าง <a href=" .... " , ในตัวแปร web_source
2.วนลูป For เพื่อนำค่าจาก file_or_path มาใส่ i ทีละตัว
3.links = url ต่อด้วย "/" ต่อด้วย i ที่ลบ character "/"
หมายเหตุ* ในข้อ 3 ที่ต้องทำก็เนื่องจากบางค่าใน file_or_path อาจมี Slash หรือไม่มี ซึ่งค่าที่เราต้องการคือ "ต้องมี" เพื่อที่สุดท้ายเราจะได้ผลลัพธ์ดังนี้ http://url.com/file_or_path
โดยไม่ต้องกลัวว่าจะมี Slash ซ้ำกัน จอบอ