정규표현식을 사용해서 문자열에서 한글만 가져오기
문서에서 단어를 추출하는 작업을 하고 있는데, 문자열에서 한글만 가져와야 할 일이 생겼습니다. 문자열에서 한글만을 가져오기 위해 두 가지 방법을 생각했습니다. 일단 한글이 정의되어 있는 유니코드 영역은 AC00-D7AF, 1100-11FF, 3130-318F입니다. 이 영역에 대해서는 [유니코드] 한글과 한자 영역 또는 http://www.unicode.org/charts/에서 Korean-specific 부분을 참조해주세요. 첫번째는 그냥 첫번째 문자부터 읽어서 한글이면 StringBuffer에 append하고 아니면 공백문자를 append하는 방법입니다. 위와 같이 무식하게 char하나하나 확인하는 방법이 되겠습니다. 두번째는 정규표현식을 사용해서 한글이 아닌 문자를 공백문자로 바꾸는 것입니다. 아래..
Java
2009. 4. 10. 19:27
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- Java
- 모토로이
- smplayer
- yum update
- tsclient
- OpenJDK6
- xml2
- OO3
- subervsion
- Numbering
- userguide
- GMT
- output driver
- SimpleDateFormat
- pl/java
- Eclipse
- JavaMail
- PostgreSQL
- 병합정렬
- 파란 화면을 보았니
- 출력드라이버
- Fedora 9
- Arrays
- Fedora 8
- 다음팟인코더
- gl2
- openoffice
- Linux
- 리눅스
- IcedTea6
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
글 보관함