마스터Q&A 안드로이드는 안드로이드 개발자들의 질문과 답변을 위한 지식 커뮤니티 사이트입니다. 안드로이드펍에서 운영하고 있습니다. [사용법, 운영진]

HTML 파싱 질문드립니다!

0 추천

 

안드로이드에서 웹에 접속했을때 나오는 HTML 내용입니다.

href=" 와 "> 

사이에 있는 주소를 파싱해오고 싶습니다.

다른건 파싱해왔는데 저 부분은 어떻게 파싱해야 할지 생각이 안나네요.

도움부탁드립니다!

수원역 (140 포인트) 님이 2015년 7월 1일 질문

2개의 답변

0 추천
html도 DOM 이니 xml, 혹은 DOM 관련해서 찾아보시면 생각보다 쉽게 해결될수도 있을 듯한데요.

일단 <a ...> 은 tag class="..." 는 attribute 니 a 태그의 href attribute을 찾아내시면 될것 같긴합니다. 즉 <a ...> 태그를 DOM 노드로만 만드시면 href 이하를 찾아 내시긴 쉬워질듯 보입니다.

그게 아니시고 문자열을 받아서 파싱처리하시는 것이시라면

규칙을 생각하셔야하는데 기본적인 컨셉은 토큰을 만드는 것이라고 생각하셔야하는데 즉 a태그의 내용들을 각각으로 분리하셔야하는데 기본규칙은 공백으로 각 속성들은 분리되는데 ", ' 내부의 공백은 공백이 아니다라는 규칙을 적용하셔서 처리 하셔야 할듯 합니다. split 같은 것으로 단순분리는 힘들 듯 보입니다.
컴러기 (22,230 포인트) 님이 2015년 7월 2일 답변
0 추천
jericho 같은 라이브러리를 사용하는 것도 좋아요
쎄미 (162,410 포인트) 님이 2015년 7월 2일 답변
...