rust/src/comp/fe/lexer.rs

import std._io.stdio_reader;
import std._str;
import std.map;
import std.map.hashmap;

fn new_str_hash[V]() -> map.hashmap[str,V] {
    let map.hashfn[str] hasher = _str.hash;
    let map.eqfn[str] eqer = _str.eq;
    ret map.mk_hashmap[str,V](hasher, eqer);
}

type reader = obj {
              fn is_eof() -> bool;
              fn curr() -> char;
              fn next() -> char;
              fn bump();
              fn get_curr_pos() -> tup(str,uint,uint);
              fn get_keywords() -> hashmap[str,token.token];
              fn get_reserved() -> hashmap[str,()];
};

fn new_reader(stdio_reader rdr, str filename) -> reader
{
    obj reader(stdio_reader rdr,
               str filename,
               mutable char c,
               mutable char n,
               mutable uint line,
               mutable uint col,
               hashmap[str,token.token] keywords,
               hashmap[str,()] reserved)
        {
            fn is_eof() -> bool {
                ret c == (-1) as char;
            }

            fn get_curr_pos() -> tup(str,uint,uint) {
                ret tup(filename, line, col);
            }

            fn curr() -> char {
                ret c;
            }

            fn next() -> char {
                ret n;
            }

            fn bump() {
                c = n;

                if (c == (-1) as char) {
                    ret;
                }

                if (c == '\n') {
                    line += 1u;
                    col = 0u;
                } else {
                    col += 1u;
                }

                n = rdr.getc() as char;
            }

            fn get_keywords() -> hashmap[str,token.token] {
                ret keywords;
            }

            fn get_reserved() -> hashmap[str,()] {
                ret reserved;
            }
        }

    auto keywords = new_str_hash[token.token]();
    auto reserved = new_str_hash[()]();

    keywords.insert("mod", token.MOD());
    keywords.insert("use", token.USE());
    keywords.insert("meta", token.META());
    keywords.insert("auth", token.AUTH());

    keywords.insert("syntax", token.SYNTAX());

    keywords.insert("if", token.IF());
    keywords.insert("else", token.ELSE());
    keywords.insert("while", token.WHILE());
    keywords.insert("do", token.DO());
    keywords.insert("alt", token.ALT());
    keywords.insert("case", token.CASE());

    keywords.insert("for", token.FOR());
    keywords.insert("each", token.EACH());
    keywords.insert("put", token.PUT());
    keywords.insert("ret", token.RET());
    keywords.insert("be", token.BE());

    ret reader(rdr, filename, rdr.getc() as char, rdr.getc() as char,
               1u, 1u, keywords, reserved);
}


fn in_range(char c, char lo, char hi) -> bool {
    ret lo <= c && c <= hi;
}

fn is_alpha(char c) -> bool {
    ret in_range(c, 'a', 'z') ||
        in_range(c, 'A', 'Z');
}

fn is_dec_digit(char c) -> bool {
    ret in_range(c, '0', '9');
}

fn is_hex_digit(char c) -> bool {
    ret in_range(c, '0', '9') ||
        in_range(c, 'a', 'f') ||
        in_range(c, 'A', 'F');
}

fn is_bin_digit(char c) -> bool {
    ret c == '0' || c == '1';
}

fn is_whitespace(char c) -> bool {
    ret c == ' ' || c == '\t' || c == '\r' || c == '\n';
}

fn consume_any_whitespace(reader rdr) {
    while (is_whitespace(rdr.curr())) {
        rdr.bump();
    }
    be consume_any_line_comment(rdr);
}

fn consume_any_line_comment(reader rdr) {
    if (rdr.curr() == '/') {
        if (rdr.next() == '/') {
            while (rdr.curr() != '\n') {
                rdr.bump();
            }
            // Restart whitespace munch.
            be consume_any_whitespace(rdr);
        }
    }
}

fn next_token(reader rdr) -> token.token {
    auto accum_str = "";
    auto accum_int = 0;

    consume_any_whitespace(rdr);

    if (rdr.is_eof()) { ret token.EOF(); }

    auto c = rdr.curr();

    if (is_alpha(c)) {
        while (is_alpha(rdr.curr())) {
            c = rdr.curr();
            accum_str += (c as u8);
            rdr.bump();
        }
        ret token.IDENT(accum_str);
    }

    if (is_dec_digit(c)) {
        if (c == '0') {
            log "fixme: leading zero";
            fail;
        } else {
            while (is_dec_digit(c)) {
                c = rdr.curr();
                accum_int *= 10;
                accum_int += (c as int) - ('0' as int);
                rdr.bump();
            }
            ret token.LIT_INT(accum_int);
        }
    }


    fn op_or_opeq(reader rdr, token.op op) -> token.token {
        rdr.bump();
        if (rdr.next() == '=') {
            rdr.bump();
            ret token.OPEQ(op);
        } else {
            ret token.OP(op);
        }
    }

    alt (c) {
        // One-byte tokens.
        case (';') { rdr.bump(); ret token.SEMI(); }
        case (',') { rdr.bump(); ret token.COMMA(); }
        case ('.') { rdr.bump(); ret token.DOT(); }
        case ('(') { rdr.bump(); ret token.LPAREN(); }
        case (')') { rdr.bump(); ret token.RPAREN(); }
        case ('{') { rdr.bump(); ret token.LBRACE(); }
        case ('}') { rdr.bump(); ret token.RBRACE(); }
        case ('[') { rdr.bump(); ret token.LBRACKET(); }
        case (']') { rdr.bump(); ret token.RBRACKET(); }
        case ('@') { rdr.bump(); ret token.AT(); }
        case ('#') { rdr.bump(); ret token.POUND(); }

        // Multi-byte tokens.
        case ('=') {
            if (rdr.next() == '=') {
                rdr.bump();
                rdr.bump();
                ret token.OP(token.EQEQ());
            } else {
                rdr.bump();
                ret token.OP(token.EQ());
            }
        }

        case ('\'') {
            rdr.bump();
            auto c2 = rdr.curr();
            if (c2 == '\\') {
                alt (rdr.next()) {
                    case ('n') { rdr.bump(); c2 = '\n'; }
                    case ('r') { rdr.bump(); c2 = '\r'; }
                    case ('t') { rdr.bump(); c2 = '\t'; }
                    case ('\\') { rdr.bump(); c2 = '\\'; }
                    case ('\'') { rdr.bump(); c2 = '\''; }
                    // FIXME: unicode numeric escapes.
                    case (c2) {
                        log "unknown character escape";
                        log c2;
                        fail;
                    }
                }
            }

            if (rdr.next() != '\'') {
                log "unterminated character constant";
                fail;
            }
            rdr.bump();
            rdr.bump();
            ret token.LIT_CHAR(c2);
        }

        case ('"') {
            rdr.bump();
            // FIXME: general utf8-consumption support.
            while (rdr.curr() != '"') {
                alt (rdr.curr()) {
                    case ('\\') {
                        alt (rdr.next()) {
                            case ('n') {
                                rdr.bump();
                                accum_str += '\n' as u8;
                            }
                            case ('r') {
                                rdr.bump();
                                accum_str += '\r' as u8;
                            }
                            case ('t') {
                                rdr.bump();
                                accum_str += '\t' as u8;
                            }
                            case ('\\') {
                                rdr.bump();
                                accum_str += '\\' as u8;
                            }
                            case ('"') {
                                rdr.bump();
                                accum_str += '"' as u8;
                            }
                            // FIXME: unicode numeric escapes.
                            case (c2) {
                                log "unknown string escape";
                                log c2;
                                fail;
                            }
                        }
                    }
                    case (_) {
                        accum_str += rdr.curr() as u8;
                    }
                }
                rdr.bump();
            }
            rdr.bump();
            ret token.LIT_STR(accum_str);
        }

        case ('-') {
            if (rdr.next() == '>') {
                rdr.bump();
                rdr.bump();
                ret token.RARROW();
            } else {
                ret op_or_opeq(rdr, token.MINUS());
            }
        }

        case ('&') {
            if (rdr.next() == '&') {
                rdr.bump();
                rdr.bump();
                ret token.OP(token.ANDAND());
            } else {
                ret op_or_opeq(rdr, token.AND());
            }
        }

        case ('+') {
            ret op_or_opeq(rdr, token.PLUS());
        }

        case ('*') {
            ret op_or_opeq(rdr, token.STAR());
        }

        case ('/') {
            ret op_or_opeq(rdr, token.STAR());
        }

        case ('!') {
            ret op_or_opeq(rdr, token.NOT());
        }

        case ('^') {
            ret op_or_opeq(rdr, token.CARET());
        }

        case ('%') {
            ret op_or_opeq(rdr, token.PERCENT());
        }

    }

    log "lexer stopping at ";
    log c;
    ret token.EOF();
}


//
// Local Variables:
// mode: rust
// fill-column: 78;
// indent-tabs-mode: nil
// c-basic-offset: 4
// buffer-file-coding-system: utf-8-unix
// compile-command: "make -k -C ../.. 2>&1 | sed -e 's/\\/x\\//x:\\//g'";
// End:
//
Simplify lexer/parser structure to use stdio_reader. 2010-08-19 00:41:13 +02:00			`import std._io.stdio_reader;`
Add lexer.reader to rustc for tracking position, char conversion, holding keyword tables. 2010-08-24 18:59:41 +02:00			`import std._str;`
			`import std.map;`
			`import std.map.hashmap;`

			`fn new_str_hash[V]() -> map.hashmap[str,V] {`
			`let map.hashfn[str] hasher = _str.hash;`
			`let map.eqfn[str] eqer = _str.eq;`
			`ret map.mk_hashmap[str,V](hasher, eqer);`
			`}`

			`type reader = obj {`
			`fn is_eof() -> bool;`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`fn curr() -> char;`
			`fn next() -> char;`
Add lexer.reader to rustc for tracking position, char conversion, holding keyword tables. 2010-08-24 18:59:41 +02:00			`fn bump();`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`fn get_curr_pos() -> tup(str,uint,uint);`
Add lexer.reader to rustc for tracking position, char conversion, holding keyword tables. 2010-08-24 18:59:41 +02:00			`fn get_keywords() -> hashmap[str,token.token];`
			`fn get_reserved() -> hashmap[str,()];`
			`};`

			`fn new_reader(stdio_reader rdr, str filename) -> reader`
			`{`
			`obj reader(stdio_reader rdr,`
			`str filename,`
			`mutable char c,`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`mutable char n,`
Add lexer.reader to rustc for tracking position, char conversion, holding keyword tables. 2010-08-24 18:59:41 +02:00			`mutable uint line,`
			`mutable uint col,`
			`hashmap[str,token.token] keywords,`
			`hashmap[str,()] reserved)`
			`{`
			`fn is_eof() -> bool {`
			`ret c == (-1) as char;`
			`}`

Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`fn get_curr_pos() -> tup(str,uint,uint) {`
Add lexer.reader to rustc for tracking position, char conversion, holding keyword tables. 2010-08-24 18:59:41 +02:00			`ret tup(filename, line, col);`
			`}`

Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`fn curr() -> char {`
Add lexer.reader to rustc for tracking position, char conversion, holding keyword tables. 2010-08-24 18:59:41 +02:00			`ret c;`
			`}`

Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`fn next() -> char {`
			`ret n;`
			`}`

Add lexer.reader to rustc for tracking position, char conversion, holding keyword tables. 2010-08-24 18:59:41 +02:00			`fn bump() {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`c = n;`

			`if (c == (-1) as char) {`
			`ret;`
			`}`

Add lexer.reader to rustc for tracking position, char conversion, holding keyword tables. 2010-08-24 18:59:41 +02:00			`if (c == '\n') {`
			`line += 1u;`
			`col = 0u;`
			`} else {`
			`col += 1u;`
			`}`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00
			`n = rdr.getc() as char;`
Add lexer.reader to rustc for tracking position, char conversion, holding keyword tables. 2010-08-24 18:59:41 +02:00			`}`

			`fn get_keywords() -> hashmap[str,token.token] {`
			`ret keywords;`
			`}`

			`fn get_reserved() -> hashmap[str,()] {`
			`ret reserved;`
			`}`
			`}`

			`auto keywords = new_str_hash[token.token]();`
			`auto reserved = new_str_hash[()]();`

			`keywords.insert("mod", token.MOD());`
			`keywords.insert("use", token.USE());`
			`keywords.insert("meta", token.META());`
			`keywords.insert("auth", token.AUTH());`

			`keywords.insert("syntax", token.SYNTAX());`

			`keywords.insert("if", token.IF());`
			`keywords.insert("else", token.ELSE());`
			`keywords.insert("while", token.WHILE());`
			`keywords.insert("do", token.DO());`
			`keywords.insert("alt", token.ALT());`
			`keywords.insert("case", token.CASE());`

			`keywords.insert("for", token.FOR());`
			`keywords.insert("each", token.EACH());`
			`keywords.insert("put", token.PUT());`
			`keywords.insert("ret", token.RET());`
			`keywords.insert("be", token.BE());`

Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`ret reader(rdr, filename, rdr.getc() as char, rdr.getc() as char,`
			`1u, 1u, keywords, reserved);`
Add lexer.reader to rustc for tracking position, char conversion, holding keyword tables. 2010-08-24 18:59:41 +02:00			`}`



Sketch some not-quite-compiling code into comp/fe/lexer.rs. 2010-07-14 18:41:36 +02:00
Add some code to lexer in rustc. 2010-08-20 03:42:17 +02:00			`fn in_range(char c, char lo, char hi) -> bool {`
Fix some lexer bugs in rustc. Beginning to lex stuff now. 2010-08-20 21:12:37 +02:00			`ret lo <= c && c <= hi;`
Add some code to lexer in rustc. 2010-08-20 03:42:17 +02:00			`}`

			`fn is_alpha(char c) -> bool {`
			`ret in_range(c, 'a', 'z') \|\|`
			`in_range(c, 'A', 'Z');`
			`}`

			`fn is_dec_digit(char c) -> bool {`
			`ret in_range(c, '0', '9');`
			`}`

			`fn is_hex_digit(char c) -> bool {`
			`ret in_range(c, '0', '9') \|\|`
			`in_range(c, 'a', 'f') \|\|`
			`in_range(c, 'A', 'F');`
			`}`

			`fn is_bin_digit(char c) -> bool {`
			`ret c == '0' \|\| c == '1';`
			`}`

			`fn is_whitespace(char c) -> bool {`
Accumulate number tokens properly, handle newline, EQ and EQEQ in rustc lexer. 2010-08-21 00:36:48 +02:00			`ret c == ' ' \|\| c == '\t' \|\| c == '\r' \|\| c == '\n';`
Add some code to lexer in rustc. 2010-08-20 03:42:17 +02:00			`}`

Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`fn consume_any_whitespace(reader rdr) {`
			`while (is_whitespace(rdr.curr())) {`
			`rdr.bump();`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`}`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`be consume_any_line_comment(rdr);`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`}`

Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`fn consume_any_line_comment(reader rdr) {`
			`if (rdr.curr() == '/') {`
			`if (rdr.next() == '/') {`
			`while (rdr.curr() != '\n') {`
			`rdr.bump();`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`}`
			`// Restart whitespace munch.`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`be consume_any_whitespace(rdr);`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`}`
			`}`
			`}`

Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`fn next_token(reader rdr) -> token.token {`
Accumulate number tokens properly, handle newline, EQ and EQEQ in rustc lexer. 2010-08-21 00:36:48 +02:00			`auto accum_str = "";`
			`auto accum_int = 0;`
Add some code to lexer in rustc. 2010-08-20 03:42:17 +02:00
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`consume_any_whitespace(rdr);`
Tidy lexer. 2010-08-24 17:50:56 +02:00
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`if (rdr.is_eof()) { ret token.EOF(); }`
Add some code to lexer in rustc. 2010-08-20 03:42:17 +02:00
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`auto c = rdr.curr();`
Fix some lexer bugs in rustc. Beginning to lex stuff now. 2010-08-20 21:12:37 +02:00
Use str += u8 in rustc lexer. 2010-08-20 19:03:31 +02:00			`if (is_alpha(c)) {`
Revert "More work on lexer.rs: start using keyword hashtable, handle more lexemes." due to tinderbox bustage This reverts commit 9f0eaa65817303b8768c80454734144c176fda43. 2010-08-28 02:29:56 +02:00			`while (is_alpha(rdr.curr())) {`
			`c = rdr.curr();`
Accumulate number tokens properly, handle newline, EQ and EQEQ in rustc lexer. 2010-08-21 00:36:48 +02:00			`accum_str += (c as u8);`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`rdr.bump();`
Expand rustc lexer to do almost-nearly-nontrivial stuff. 2010-08-20 20:41:34 +02:00			`}`
Accumulate number tokens properly, handle newline, EQ and EQEQ in rustc lexer. 2010-08-21 00:36:48 +02:00			`ret token.IDENT(accum_str);`
Use str += u8 in rustc lexer. 2010-08-20 19:03:31 +02:00			`}`
Expand rustc lexer to do almost-nearly-nontrivial stuff. 2010-08-20 20:41:34 +02:00
			`if (is_dec_digit(c)) {`
Revert "More work on lexer.rs: start using keyword hashtable, handle more lexemes." due to tinderbox bustage This reverts commit 9f0eaa65817303b8768c80454734144c176fda43. 2010-08-28 02:29:56 +02:00			`if (c == '0') {`
			`log "fixme: leading zero";`
			`fail;`
			`} else {`
			`while (is_dec_digit(c)) {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`c = rdr.curr();`
Revert "More work on lexer.rs: start using keyword hashtable, handle more lexemes." due to tinderbox bustage This reverts commit 9f0eaa65817303b8768c80454734144c176fda43. 2010-08-28 02:29:56 +02:00			`accum_int *= 10;`
			`accum_int += (c as int) - ('0' as int);`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`rdr.bump();`
Expand rustc lexer to do almost-nearly-nontrivial stuff. 2010-08-20 20:41:34 +02:00			`}`
Revert "More work on lexer.rs: start using keyword hashtable, handle more lexemes." due to tinderbox bustage This reverts commit 9f0eaa65817303b8768c80454734144c176fda43. 2010-08-28 02:29:56 +02:00			`ret token.LIT_INT(accum_int);`
Expand rustc lexer to do almost-nearly-nontrivial stuff. 2010-08-20 20:41:34 +02:00			`}`
			`}`

Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`fn op_or_opeq(reader rdr, token.op op) -> token.token {`
			`rdr.bump();`
			`if (rdr.next() == '=') {`
			`rdr.bump();`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`ret token.OPEQ(op);`
			`} else {`
			`ret token.OP(op);`
			`}`
			`}`

Use pattern matching for the one-byte structural symbols in the self-hosted compiler 2010-08-20 23:34:48 +02:00			`alt (c) {`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`// One-byte tokens.`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`case (';') { rdr.bump(); ret token.SEMI(); }`
			`case (',') { rdr.bump(); ret token.COMMA(); }`
			`case ('.') { rdr.bump(); ret token.DOT(); }`
			`case ('(') { rdr.bump(); ret token.LPAREN(); }`
			`case (')') { rdr.bump(); ret token.RPAREN(); }`
			`case ('{') { rdr.bump(); ret token.LBRACE(); }`
			`case ('}') { rdr.bump(); ret token.RBRACE(); }`
			`case ('[') { rdr.bump(); ret token.LBRACKET(); }`
			`case (']') { rdr.bump(); ret token.RBRACKET(); }`
			`case ('@') { rdr.bump(); ret token.AT(); }`
			`case ('#') { rdr.bump(); ret token.POUND(); }`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00
			`// Multi-byte tokens.`
Accumulate number tokens properly, handle newline, EQ and EQEQ in rustc lexer. 2010-08-21 00:36:48 +02:00			`case ('=') {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`if (rdr.next() == '=') {`
			`rdr.bump();`
			`rdr.bump();`
Accumulate number tokens properly, handle newline, EQ and EQEQ in rustc lexer. 2010-08-21 00:36:48 +02:00			`ret token.OP(token.EQEQ());`
			`} else {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`rdr.bump();`
Accumulate number tokens properly, handle newline, EQ and EQEQ in rustc lexer. 2010-08-21 00:36:48 +02:00			`ret token.OP(token.EQ());`
			`}`
			`}`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00
Add very basic char / str literal handling to rustc lexer. 2010-08-24 17:56:42 +02:00			`case ('\'') {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`rdr.bump();`
			`auto c2 = rdr.curr();`
Add very basic char / str literal handling to rustc lexer. 2010-08-24 17:56:42 +02:00			`if (c2 == '\\') {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`alt (rdr.next()) {`
			`case ('n') { rdr.bump(); c2 = '\n'; }`
			`case ('r') { rdr.bump(); c2 = '\r'; }`
			`case ('t') { rdr.bump(); c2 = '\t'; }`
			`case ('\\') { rdr.bump(); c2 = '\\'; }`
			`case ('\'') { rdr.bump(); c2 = '\''; }`
Add very basic char / str literal handling to rustc lexer. 2010-08-24 17:56:42 +02:00			`// FIXME: unicode numeric escapes.`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`case (c2) {`
Add very basic char / str literal handling to rustc lexer. 2010-08-24 17:56:42 +02:00			`log "unknown character escape";`
			`log c2;`
			`fail;`
			`}`
			`}`
			`}`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00
			`if (rdr.next() != '\'') {`
Add very basic char / str literal handling to rustc lexer. 2010-08-24 17:56:42 +02:00			`log "unterminated character constant";`
			`fail;`
			`}`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`rdr.bump();`
			`rdr.bump();`
Add very basic char / str literal handling to rustc lexer. 2010-08-24 17:56:42 +02:00			`ret token.LIT_CHAR(c2);`
			`}`

			`case ('"') {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`rdr.bump();`
Add very basic char / str literal handling to rustc lexer. 2010-08-24 17:56:42 +02:00			`// FIXME: general utf8-consumption support.`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`while (rdr.curr() != '"') {`
			`alt (rdr.curr()) {`
Add very basic char / str literal handling to rustc lexer. 2010-08-24 17:56:42 +02:00			`case ('\\') {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`alt (rdr.next()) {`
Whitespace shuffle in rustc's lexer to fit 78-column rule and put out burning tinderbox. 2010-08-27 22:36:18 +02:00			`case ('n') {`
			`rdr.bump();`
			`accum_str += '\n' as u8;`
			`}`
			`case ('r') {`
			`rdr.bump();`
			`accum_str += '\r' as u8;`
			`}`
			`case ('t') {`
			`rdr.bump();`
			`accum_str += '\t' as u8;`
			`}`
			`case ('\\') {`
			`rdr.bump();`
			`accum_str += '\\' as u8;`
			`}`
			`case ('"') {`
			`rdr.bump();`
			`accum_str += '"' as u8;`
			`}`
Add very basic char / str literal handling to rustc lexer. 2010-08-24 17:56:42 +02:00			`// FIXME: unicode numeric escapes.`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`case (c2) {`
Add very basic char / str literal handling to rustc lexer. 2010-08-24 17:56:42 +02:00			`log "unknown string escape";`
			`log c2;`
			`fail;`
			`}`
			`}`
			`}`
			`case (_) {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`accum_str += rdr.curr() as u8;`
Add very basic char / str literal handling to rustc lexer. 2010-08-24 17:56:42 +02:00			`}`
			`}`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`rdr.bump();`
Add very basic char / str literal handling to rustc lexer. 2010-08-24 17:56:42 +02:00			`}`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`rdr.bump();`
Add very basic char / str literal handling to rustc lexer. 2010-08-24 17:56:42 +02:00			`ret token.LIT_STR(accum_str);`
			`}`

Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`case ('-') {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`if (rdr.next() == '>') {`
			`rdr.bump();`
			`rdr.bump();`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`ret token.RARROW();`
			`} else {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`ret op_or_opeq(rdr, token.MINUS());`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`}`
			`}`

			`case ('&') {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`if (rdr.next() == '&') {`
			`rdr.bump();`
			`rdr.bump();`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`ret token.OP(token.ANDAND());`
			`} else {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`ret op_or_opeq(rdr, token.AND());`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`}`
			`}`

			`case ('+') {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`ret op_or_opeq(rdr, token.PLUS());`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`}`

			`case ('*') {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`ret op_or_opeq(rdr, token.STAR());`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`}`

			`case ('/') {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`ret op_or_opeq(rdr, token.STAR());`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`}`

			`case ('!') {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`ret op_or_opeq(rdr, token.NOT());`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`}`

			`case ('^') {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`ret op_or_opeq(rdr, token.CARET());`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`}`

			`case ('%') {`
Modify rustboot to use lexer.reader. 2010-08-27 21:36:57 +02:00			`ret op_or_opeq(rdr, token.PERCENT());`
Handle line-comments and a few more symbols in rustc lexer. 2010-08-24 04:17:04 +02:00			`}`

Use pattern matching for the one-byte structural symbols in the self-hosted compiler 2010-08-20 23:34:48 +02:00			`}`
Expand rustc lexer to do almost-nearly-nontrivial stuff. 2010-08-20 20:41:34 +02:00
			`log "lexer stopping at ";`
Simplify lexer/parser structure to use stdio_reader. 2010-08-19 00:41:13 +02:00			`log c;`
			`ret token.EOF();`
Sketch some not-quite-compiling code into comp/fe/lexer.rs. 2010-07-14 18:41:36 +02:00			`}`

Add do-nothing obj type for lexer to rustc. 2010-08-18 20:35:34 +02:00
Add modelines and related emacs chatter to rustc. 2010-08-12 19:29:23 +02:00			`//`
			`// Local Variables:`
			`// mode: rust`
			`// fill-column: 78;`
			`// indent-tabs-mode: nil`
			`// c-basic-offset: 4`
			`// buffer-file-coding-system: utf-8-unix`
			`// compile-command: "make -k -C ../.. 2>&1 \| sed -e 's/\\/x\\//x:\\//g'";`
			`// End:`
			`//`