0

私はstandfordNER分類器を使ってテキストを分類しました。 ここにコードがあります。standfordnerクラシファイアからxml出力を生成するにはどうすればよいですか?

string docText = fileContent; 
     string txt = ""; 
     var classified = Classifier.classifyToCharacterOffsets(docText).toArray(); 

     for (int i = 0; i < classified.Length; i++) 
     { 
      Triple triple = (Triple)classified[i]; 

      int second = Convert.ToInt32(triple.second().ToString()); 
      int third = Convert.ToInt32(triple.third().ToString()); 
      txt = txt + ('\t' + triple.first().ToString() + '\t' + docText.Substring(second, third - second)); 

      string s = Classifier.classifyWithInlineXML(txt); 
      string s1 = Classifier.classifyToString(s, "xml", true); 
      Panel1.GroupingText = s1; 

     } 


     Panel1.Visible = true; 

とはこれが置いてある:

LOCATION Lanka LOCATION colombo ORGANIZATION microsoft 

しかし、私は、私が使用している私のコードでは、この

<LOCATION> Lanka </LOCATION> <LOCATION>colombo</LOCATION> <ORGANIZATION> microsoft</ORGANIZATION> 

のようなXML形式で入れてを必要とする

string s = Classifier.classifyWithInlineXML(txt); 
      string s1 = Classifier.classifyToString(s, "xml", true); 

xmlを取得するが動作しません。私はこの分野に新しいので、私はこれを解決するための助けをしてください。 どうもありがとう

答えて

1

は、このサンプルコードは助けになるはずです:

String content = "..."; 
    String classifierPath = "edu/stanford/nlp/models/ner/english.all.3class.distsim.crf.ser.gz"; 
    AbstractSequenceClassifier<CoreLabel> asc = CRFClassifier.getClassifierNoExceptions(classifierPath); 
    String result = asc.classifyWithInlineXML(content); 
関連する問題