java parser

2023-03-05 03:10:02Python019

java parser,第1张

java parser是什么，让我们一起了解一下？

Java Parser是基于JavaCC作为Java语言词法解析的工具，支持Java语言生成AST（Abstract Syntax Tree抽象语法树），在AST基础上进行类型推断分析，支持修改AST从而生成新的Java文件内容，支持从Java 1.0到14所有的版本的AST解析。

AST结构允许以一种简单的编程方式使用Java代码。可以专门操作Java文件，使用起来也更简单。它提供了一种方便的机制，可以使用我们称为“访客支持”的功能来导航树。这使开发人员能够专注于在源代码中识别有趣的模式，而不必编写费力的树遍历代码。该库的最终主要功能是能够操纵源代码的基础结构。然后可以将其写入文件，为开发人员提供构建自己的代码生成软件的便利。

那么我们使用JavaParser theere时，总是希望进行很多操作。

例如，我们希望对整个项目进行操作，因此在给定目录的情况下，我们将探索所有Java文件。此类应有助于完成此任务：

package me.tomassetti.support import java.io.File public class DirExplorer { public interface FileHandler { void handle(int level, String path, File file) } public interface Filter { boolean interested(int level, String path, File file) } private FileHandler fileHandler private Filter filter public DirExplorer(Filter filter, FileHandler fileHandler) { this.filter = filter this.fileHandler = fileHandler } public void explore(File root) { explore(0, "", root) } private void explore(int level, String path, File file) { if (file.isDirectory()) { for (File child : file.listFiles()) { explore(level + 1, path + "/" + child.getName(), child) } } else { if (filter.interested(level, path, file)) { fileHandler.handle(level, path, file) } } } }

对于每个Java文件，我们首先要为每个Java文件构建一个抽象语法树（AST），然后对其进行导航。这样做有两种主要策略：

1、使用访客：要在特定类型的AST节点上进行操作时，这是正确的策略。

2、使用递归迭代器：这允许处理所有类型的节点。

首先看下我们要分析的代码段如下：

输出结果如下：

输出结果(a).PNG

输出结果(b).PNG

输出结果(c).PNG

括号里是一个二元式：（单词类别编码，单词位置编号）

代码如下：

1234567891011121314package Yue.LexicalAnalyzer import java.io.* /* * 主程序 */public class Main { public static void main(String[] args) throws IOException { Lexer lexer = new Lexer() lexer.printToken() lexer.printSymbolsTable() }}

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283package Yue.LexicalAnalyzer import java.io.*import java.util.* /* * 词法分析并输出 */public class Lexer { /*记录行号*/ public static int line = 1 /*存放最新读入的字符*/ char character = ' ' /*保留字*/ Hashtable<String, KeyWord>keywords = new Hashtable<String, KeyWord>() /*token序列*/ private ArrayList<Token>tokens = new ArrayList<Token>() /*符号表*/ private ArrayList<Symbol>symtable = new ArrayList<Symbol>() /*读取文件变量*/ BufferedReader reader = null /*保存当前是否读取到了文件的结尾*/ private Boolean isEnd = false /* 是否读取到文件的结尾 */ public Boolean getReaderState() { return this.isEnd } /*打印tokens序列*/ public void printToken() throws IOException { FileWriter writer = new FileWriter("E:\\lex.txt") System.out.println("词法分析结果如下：") System.out.print("杜悦-2015220201031\r\n\n") writer.write("杜悦-2015220201031\r\n\r\n") while (getReaderState() == false) { Token tok = scan() String str = "line " + tok.line + "\t(" + tok.tag + "," + tok.pos + ")\t\t" + tok.name + ": " + tok.toString() + "\r\n" writer.write(str) System.out.print(str) } writer.flush() } /*打印符号表*/ public void printSymbolsTable() throws IOException { FileWriter writer = new FileWriter("E:\\symtab1.txt") System.out.print("\r\n\r\n符号表\r\n") System.out.print("编号\t行号\t名称\r\n") writer.write("符号表\r\n") writer.write("编号 " + "\t行号 " + "\t名称 \r\n") Iterator<Symbol>e = symtable.iterator() while (e.hasNext()) { Symbol symbol = e.next() String desc = symbol.pos + "\t" + symbol.line + "\t" + symbol.toString() System.out.print(desc + "\r\n") writer.write(desc + "\r\n") } writer.flush() } /*打印错误*/ public void printError(Token tok) throws IOException{ FileWriter writer = new FileWriter("E:\\error.txt") System.out.print("\r\n\r\n错误词法如下：\r\n") writer.write("错误词法如下：\r\n") String str = "line " + tok.line + "\t(" + tok.tag + "," + tok.pos + ")\t\t" + tok.name + ": " + tok.toString() + "\r\n" writer.write(str) } /*添加保留字*/ void reserve(KeyWord w) { keywords.put(w.lexme, w) } public Lexer() { /*初始化读取文件变量*/ try { reader = new BufferedReader(new FileReader("E:\\输入.txt")) } catch (IOException e) { System.out.print(e) } /*添加保留字*/ this.reserve(KeyWord.begin) this.reserve(KeyWord.end) this.reserve(KeyWord.integer) this.reserve(KeyWord.function) this.reserve(KeyWord.read) this.reserve(KeyWord.write) this.reserve(KeyWord.aIf) this.reserve(KeyWord.aThen) this.reserve(KeyWord.aElse) } /*按字符读*/ public void readch() throws IOException { character = (char) reader.read() if ((int) character == 0xffff) { this.isEnd = true } } /*判断是否匹配*/ public Boolean readch(char ch) throws IOException { readch() if (this.character != ch) { return false } this.character = ' ' return true } /*数字的识别*/ public Boolean isDigit() throws IOException { if (Character.isDigit(character)) { int value = 0 while (Character.isDigit(character)) { value = 10 * value + Character.digit(character, 10) readch() } Num n = new Num(value) n.line = line tokens.add(n) return true } else return false } /*保留字、标识符的识别*/ public Boolean isLetter() throws IOException { if (Character.isLetter(character)) { StringBuffer sb = new StringBuffer() /*首先得到整个的一个分割*/ while (Character.isLetterOrDigit(character)) { sb.append(character) readch() } /*判断是保留字还是标识符*/ String s = sb.toString() KeyWord w = keywords.get(s) /*如果是保留字的话，w不应该是空的*/ if (w != null) { w.line = line tokens.add(w) } else { /*否则就是标识符，此处多出记录标识符编号的语句*/ Symbol sy = new Symbol(s) Symbol mark = sy //用于标记已存在标识符 Boolean isRepeat = false sy.line = line for (Symbol i : symtable) { if (sy.toString().equals(i.toString())) { mark = i isRepeat = true } } if (!isRepeat) { sy.pos = symtable.size() + 1 symtable.add(sy) } else if (isRepeat) { sy.pos = mark.pos } tokens.add(sy) } return true } else return false } /*符号的识别*/ public Boolean isSign() throws IOException { switch (character) { case '#': readch() AllEnd.allEnd.line = line tokens.add(AllEnd.allEnd) return true case '\r': if (readch('\n')) { readch() LineEnd.lineEnd.line = line tokens.add(LineEnd.lineEnd) line++ return true } case '(': readch() Delimiter.lpar.line = line tokens.add(Delimiter.lpar) return true case ')': readch() Delimiter.rpar.line = line tokens.add(Delimiter.rpar) return true case '': readch() Delimiter.sem.line = line tokens.add(Delimiter.sem) return true case '+': readch() CalcWord.add.line = line tokens.add(CalcWord.add) return true case '-': readch() CalcWord.sub.line = line tokens.add(CalcWord.sub) return true case '*': readch() CalcWord.mul.line = line tokens.add(CalcWord.mul) return true case '/': readch() CalcWord.div.line = line tokens.add(CalcWord.div) return true case ':': if (readch('=')) { readch() CalcWord.assign.line = line tokens.add(CalcWord.assign) return true } break case '>': if (readch('=')) { readch() CalcWord.ge.line = line tokens.add(CalcWord.ge) return true } break case '<': if (readch('=')) { readch() CalcWord.le.line = line tokens.add(CalcWord.le) return true } break case '!': if (readch('=')) { readch() CalcWord.ne.line = line tokens.add(CalcWord.ne) return true } break } return false } /*下面开始分割关键字，标识符等信息*/ public Token scan() throws IOException { Token tok while (character == ' ') readch() if (isDigit() || isSign() || isLetter()) { tok = tokens.get(tokens.size() - 1) } else { tok = new Token(character) printError(tok) } return tok }}

标识符词法文件行号符号

# 上一篇：小米 (MI)Ruby 15.6英寸(i5-8250U 8G 1T+128G 这个笔记本怎么样

# 下一篇：css ps倒过来