본문 바로가기

자료

[한글 ActiveX C#] 한글문서로 부터 Text, Html추출

728x90

 

블로그 인기글

● 메이플스토리 신규 룬패치/자동해제 프로그램 [링크 이동]

● 메이플스토리 거짓말탐지기 알림 프로그램 [링크 이동]

C#에서 TensorFlow 사용하는법 [링크 이동]


 

string filePath = @"c:\sample.hwp"   //샘플 한글파일의 경로
HwpCtrl1.Open(filePath);

textBox.text = HwpCtrl1.GetTextFile("TEXT","").ToString();  
// 작업환경은 윈폼이고, 폼에 textBox가 올려져 있다고 가정한 코드이다.
// 한글 파일로부터 TEXT 추출시 HTML로 추출을 원하면 해당 값을 HTML로 입력하면 된다.

참 쉽죠잉~~~!!



삽질하다 알게된 다른 방법이 있다.

string filePath = @"c:\sample.hwp"   //샘플 한글파일의 경로
HwpCtrl1.Open(filePath);

// 여기까지는 동일하다.

HwpCtrl1.InitScan();   // 문서 검색을 위한 초기화
while(GetText() != 1)
{
}
HwpCtrl1.ReleaseScan();   //InitScan()으로 설정된 정보를 초기화 한다.


private int GetText()
        {
            int ret = 0;

            HWPCONTROLLib.HwpParameterSet TextSet; 
            TextSet = (HWPCONTROLLib.HwpParameterSet)HwpCtrl1.CreateSet("GetText");
            ret = HwpCtrl1.GetTextBySet(TextSet);
            var txt = TextSet.Item("Text");
           
            textBox1.Text += txt;
            return ret;
        }
728x90