안녕하세요,
XE기반 웹사이트를 파싱해서 네이티브 App을 만드려고 하는데요,
XE 게시판을 html로받아와서 parsing하려고 하는데 잘 안되네요..
Jsoup, Jericho Parser 등 다 써봐도 계속 같은 아래와 같이 EOFException 에러만 나네요 ㅠㅠ
파싱하려는 사이트는 아래와 같이 XE기반의 사이트입니다.(예시주소입니다~)
http://www.seoularirangfestival.com/index.php?mid=arirangmedia&page=1
혹시 방법을 좀 아실분이 계실까요? ㅠㅠ
#코드1
public final static String AGENT_MOBIEL = "Dalvik/1.6.0 (Linux; U; Android 4.1.1; Google Galaxy Nexus - 4.1.1 - API 16 - 720x1280 Build/JRO03S)";
Document doc = Jsoup.connect(url).userAgent(AGENT_MOBIEL).get();
구글링했더니 charset을 넣으라고해서, UTF-8 로도 해봤지만 마찬가지로 에러가 납니다..ㅠㅠㅠㅠㅠㅠ
#코드2
Document doc = Jsoup.parse( new URL( url ).openStream( ), "UTF-8", url ); // 두 번째 방법
06-20 23:54:54.147 W 14280 14300 System.err: java.io.EOFException
06-20 23:54:54.147 W 14280 14300 System.err: at java.util.zip.InflaterInputStream.read(InflaterInputStream.java:169)
06-20 23:54:54.157 W 14280 14300 System.err: at java.util.zip.GZIPInputStream.read(GZIPInputStream.java:163)
06-20 23:54:54.157 W 14280 14300 System.err: at java.io.InputStreamReader.read(InputStreamReader.java:233)
06-20 23:54:54.157 W 14280 14300 System.err: at net.htmlparser.jericho.Util.getString(Util.java:56)
06-20 23:54:54.157 W 14280 14300 System.err: at net.htmlparser.jericho.Source.<init>(Source.java:132)
06-20 23:54:54.167 W 14280 14300 System.err: at net.htmlparser.jericho.Source.<init>(Source.java:174)
06-20 23:54:54.167 W 14280 14300 System.err: at com.mpark.community.Fragment_ArticleList$JsoupAsyncTask.doInBackground(Fragment_ArticleList.java:403)
06-20 23:54:54.167 W 14280 14300 System.err: at com.mpark.community.Fragment_ArticleList$JsoupAsyncTask.doInBackground(Fragment_ArticleList.java:370)
06-20 23:54:54.167 W 14280 14300 System.err: at android.os.AsyncTask$2.call(AsyncTask.java:288)
06-20 23:54:54.167 W 14280 14300 System.err: at java.util.concurrent.FutureTask.run(FutureTask.java:237)
06-20 23:54:54.167 W 14280 14300 System.err: at android.os.AsyncTask$SerialExecutor$1.run(AsyncTask.java:231)
06-20 23:54:54.177 W 14280 14300 System.err: at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1112)
06-20 23:54:54.177 W 14280 14300 System.err: at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:587)
06-20 23:54:54.177 W 14280 14300 System.err: at java.lang.Thread.run(Thread.java:841)