외국어와 모바일 개발

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

JMdict의 XML를 읽는 방법

일본어

posted by dalnimbest 2016. 8. 1. 11:37

JMDict(Japanese-Multilingual Dictionary)는 Jim Breen교수가 만든 EDict를 기반으로 만든 일본어사전이다. 홈페이지

xml로 구성되어 있으며, 이해하기 위해서는 먼저 dtd를 이해해야 한다.

아래는 기본적으로 사용되는 엘리먼트에 대한 설명이다.

<!DOCTYPE JMdict [

<!ELEMENT JMdict (entry*)>
  
<!ELEMENT entry (ent_seq, k_ele*, r_ele+, info?, sense+)>
  
<!ELEMENT ent_seq (#PCDATA)>
  
<!ELEMENT k_ele (keb, ke_inf*, ke_pri*)>
  
<!ELEMENT keb (#PCDATA)>

<!ELEMENT ke_inf (#PCDATA)>

<!ELEMENT ke_pri (#PCDATA)>



<!ELEMENT r_ele (reb, re_nokanji?, re_restr*, re_inf*, re_pri*)>

<!ELEMENT reb (#PCDATA)>

<!ELEMENT re_nokanji (#PCDATA)>

<!ELEMENT re_restr (#PCDATA)>

<!ELEMENT re_inf (#PCDATA)>

<!ELEMENT re_pri (#PCDATA)>



<!ELEMENT sense (stagk*, stagr*, pos*, xref*, ant*, field*, misc*, s_inf*, lsource*, dial*, gloss*, example*)>

<!ELEMENT stagr (#PCDATA)>

<!ELEMENT xref (#PCDATA)*>

<!ELEMENT ant (#PCDATA)*>

<!ELEMENT pos (#PCDATA)>

<!ELEMENT field (#PCDATA)>

<!ELEMENT misc (#PCDATA)>

<!ATTLIST lsource xml:lang CDATA "eng">

<!ATTLIST lsource ls_type CDATA #IMPLIED>

<!ATTLIST lsource ls_wasei CDATA #IMPLIED>

<!ELEMENT dial (#PCDATA)>

<!ELEMENT gloss (#PCDATA | pri)*>

<!ELEMENT s_inf (#PCDATA)>


<!ENTITY abbr "abbreviation">
<!ENTITY Buddh "Buddhist term">
<!ENTITY chem "chemistry term">

]>

아래는 실제xml내용중 일부이다.

<JMdict>
<entry>
<ent_seq>1171270</ent_seq>
<k_ele>
<keb>右翼</keb>
<ke_pri>ichi1</ke_pri>
<ke_pri>news1</ke_pri>
<ke_pri>nf04</ke_pri>
</k_ele>
<r_ele>
<reb>うよく</reb>
<re_pri>ichi1</re_pri>
<re_pri>news1</re_pri>
<re_pri>nf04</re_pri>
</r_ele>
<sense>
<pos>&adj-no;</pos>
<gloss>right-wing</gloss>
<gloss xml:lang="fr">aile droite (oiseau, armée, parti politique, base-ball)</gloss>
<gloss xml:lang="ru">пра́вое крыло́</gloss>
<gloss xml:lang="ru">пра́вый фланг</gloss>
<gloss xml:lang="de">die Rechte</gloss>
<gloss xml:lang="de">rechter Flügel</gloss>
</sense>
<sense>
<pos>&n;</pos>
<gloss>right field (e.g. in sport)</gloss>
<gloss>right flank</gloss>
<gloss>right wing</gloss>
<gloss xml:lang="de">{Sport}</gloss>
<gloss xml:lang="de">rechte Flanke</gloss>
<gloss xml:lang="de">rechter Flügel</gloss>
</sense>
</entry>

저작자표시

'일본어' 카테고리의 다른 글

아사히 TV로 일본어 뉴스와 대본(?)보기 (1)	2014.01.27
[일드] 라스트 신데렐라 ラスト・シンデレラ (0)	2013.09.23
일본어한자에 자동으로 후리가나 달기 (0)	2013.09.22

1 2 3 4 5 6 ··· 65

외국어와 모바일 개발

Category

Notice

Archive

My Link

Tag

Recent Comment

Recent Post

Recent Trackback

calendar

JMdict의 XML를 읽는 방법

'일본어' 카테고리의 다른 글

티스토리툴바

외국어와 모바일 개발

Category

Notice

Archive

My Link

Search

Tag

Recent Comment

Recent Post

Recent Trackback

calendar

JMdict의 XML를 읽는 방법

'일본어' 카테고리의 다른 글

티스토리툴바