Move parser code
This commit is contained in:
@@ -1 +1,615 @@
|
|||||||
package toml
|
package toml
|
||||||
|
|
||||||
|
import (
|
||||||
|
"bytes"
|
||||||
|
"encoding/hex"
|
||||||
|
"fmt"
|
||||||
|
)
|
||||||
|
|
||||||
|
type builder interface {
|
||||||
|
SimpleKey(v []byte)
|
||||||
|
|
||||||
|
StandardTableBegin()
|
||||||
|
StandardTableEnd()
|
||||||
|
ArrayTableBegin()
|
||||||
|
ArrayTableEnd()
|
||||||
|
KeyValBegin()
|
||||||
|
KeyValEnd()
|
||||||
|
ArrayBegin()
|
||||||
|
ArrayEnd()
|
||||||
|
Assignation()
|
||||||
|
|
||||||
|
StringValue(v []byte)
|
||||||
|
BoolValue(b bool)
|
||||||
|
}
|
||||||
|
|
||||||
|
type parser struct {
|
||||||
|
builder builder
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parse(b []byte) error {
|
||||||
|
b, err := p.parseExpression(b)
|
||||||
|
if err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
for len(b) > 0 {
|
||||||
|
b, err = p.parseNewline(b)
|
||||||
|
if err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
|
||||||
|
b, err = p.parseExpression(b)
|
||||||
|
if err != nil {
|
||||||
|
return err
|
||||||
|
}
|
||||||
|
}
|
||||||
|
return nil
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseNewline(b []byte) ([]byte, error) {
|
||||||
|
if b[0] == '\n' {
|
||||||
|
return b[1:], nil
|
||||||
|
}
|
||||||
|
if b[0] == '\r' {
|
||||||
|
_, rest, err := scanWindowsNewline(b)
|
||||||
|
return rest, err
|
||||||
|
}
|
||||||
|
return nil, fmt.Errorf("expected newline but got %#U", b[0])
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseExpression(b []byte) ([]byte, error) {
|
||||||
|
//expression = ws [ comment ]
|
||||||
|
//expression =/ ws keyval ws [ comment ]
|
||||||
|
//expression =/ ws table ws [ comment ]
|
||||||
|
|
||||||
|
b = p.parseWhitespace(b)
|
||||||
|
|
||||||
|
if len(b) == 0 {
|
||||||
|
return b, nil
|
||||||
|
}
|
||||||
|
|
||||||
|
if b[0] == '#' {
|
||||||
|
_, rest, err := scanComment(b)
|
||||||
|
return rest, err
|
||||||
|
}
|
||||||
|
if b[0] == '\n' || b[0] == '\r' {
|
||||||
|
return b, nil
|
||||||
|
}
|
||||||
|
|
||||||
|
var err error
|
||||||
|
if b[0] == '[' {
|
||||||
|
b, err = p.parseTable(b)
|
||||||
|
} else {
|
||||||
|
b, err = p.parseKeyval(b)
|
||||||
|
}
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
b = p.parseWhitespace(b)
|
||||||
|
|
||||||
|
if len(b) > 0 && b[0] == '#' {
|
||||||
|
_, rest, err := scanComment(b)
|
||||||
|
return rest, err
|
||||||
|
}
|
||||||
|
|
||||||
|
return b, nil
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseTable(b []byte) ([]byte, error) {
|
||||||
|
//table = std-table / array-table
|
||||||
|
if len(b) > 1 && b[1] == '[' {
|
||||||
|
return p.parseArrayTable(b)
|
||||||
|
}
|
||||||
|
return p.parseStdTable(b)
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseArrayTable(b []byte) ([]byte, error) {
|
||||||
|
//array-table = array-table-open key array-table-close
|
||||||
|
//array-table-open = %x5B.5B ws ; [[ Double left square bracket
|
||||||
|
//array-table-close = ws %x5D.5D ; ]] Double right square bracket
|
||||||
|
|
||||||
|
p.builder.ArrayTableBegin()
|
||||||
|
defer p.builder.ArrayTableEnd()
|
||||||
|
|
||||||
|
b = b[2:]
|
||||||
|
b = p.parseWhitespace(b)
|
||||||
|
b, err := p.parseKey(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
b = p.parseWhitespace(b)
|
||||||
|
b, err = expect(']', b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
return expect(']', b)
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseStdTable(b []byte) ([]byte, error) {
|
||||||
|
//std-table = std-table-open key std-table-close
|
||||||
|
//std-table-open = %x5B ws ; [ Left square bracket
|
||||||
|
//std-table-close = ws %x5D ; ] Right square bracket
|
||||||
|
|
||||||
|
p.builder.StandardTableBegin()
|
||||||
|
defer p.builder.StandardTableEnd()
|
||||||
|
|
||||||
|
b = b[1:]
|
||||||
|
b = p.parseWhitespace(b)
|
||||||
|
b, err := p.parseKey(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
b = p.parseWhitespace(b)
|
||||||
|
|
||||||
|
return expect(']', b)
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseKeyval(b []byte) ([]byte, error) {
|
||||||
|
//keyval = key keyval-sep val
|
||||||
|
|
||||||
|
p.builder.KeyValBegin()
|
||||||
|
defer p.builder.KeyValEnd()
|
||||||
|
|
||||||
|
b, err := p.parseKey(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
//keyval-sep = ws %x3D ws ; =
|
||||||
|
|
||||||
|
b = p.parseWhitespace(b)
|
||||||
|
b, err = expect('=', b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
p.builder.Assignation()
|
||||||
|
b = p.parseWhitespace(b)
|
||||||
|
|
||||||
|
return p.parseVal(b)
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseVal(b []byte) ([]byte, error) {
|
||||||
|
// val = string / boolean / array / inline-table / date-time / float / integer
|
||||||
|
if len(b) == 0 {
|
||||||
|
return nil, fmt.Errorf("expected value, not eof")
|
||||||
|
}
|
||||||
|
|
||||||
|
var err error
|
||||||
|
c := b[0]
|
||||||
|
|
||||||
|
switch c {
|
||||||
|
// strings
|
||||||
|
case '"':
|
||||||
|
var v []byte
|
||||||
|
if scanFollowsMultilineBasicStringDelimiter(b) {
|
||||||
|
v, b, err = p.parseMultilineBasicString(b)
|
||||||
|
} else {
|
||||||
|
v, b, err = p.parseBasicString(b)
|
||||||
|
}
|
||||||
|
if err == nil {
|
||||||
|
p.builder.StringValue(v)
|
||||||
|
}
|
||||||
|
return b, err
|
||||||
|
case '\'':
|
||||||
|
var v []byte
|
||||||
|
if scanFollowsMultilineLiteralStringDelimiter(b) {
|
||||||
|
v, b, err = p.parseMultilineLiteralString(b)
|
||||||
|
} else {
|
||||||
|
v, b, err = p.parseLiteralString(b)
|
||||||
|
}
|
||||||
|
if err == nil {
|
||||||
|
p.builder.StringValue(v)
|
||||||
|
}
|
||||||
|
return b, err
|
||||||
|
case 't':
|
||||||
|
if !scanFollowsTrue(b) {
|
||||||
|
return nil, fmt.Errorf("expected 'true'")
|
||||||
|
}
|
||||||
|
p.builder.BoolValue(true)
|
||||||
|
return b[4:], nil
|
||||||
|
case 'f':
|
||||||
|
if !scanFollowsFalse(b) {
|
||||||
|
return nil, fmt.Errorf("expected 'false'")
|
||||||
|
}
|
||||||
|
p.builder.BoolValue(false)
|
||||||
|
return b[5:], nil
|
||||||
|
case '[':
|
||||||
|
return p.parseValArray(b)
|
||||||
|
case '{':
|
||||||
|
return p.parseInlineTable(b)
|
||||||
|
|
||||||
|
// TODO date-time
|
||||||
|
|
||||||
|
// TODO float
|
||||||
|
|
||||||
|
// TODO integer
|
||||||
|
default:
|
||||||
|
return nil, fmt.Errorf("unexpected char")
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseLiteralString(b []byte) ([]byte, []byte, error) {
|
||||||
|
v, rest, err := scanLiteralString(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, nil, err
|
||||||
|
}
|
||||||
|
return v[1 : len(v)-1], rest, nil
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseInlineTable(b []byte) ([]byte, error) {
|
||||||
|
//inline-table = inline-table-open [ inline-table-keyvals ] inline-table-close
|
||||||
|
//inline-table-open = %x7B ws ; {
|
||||||
|
//inline-table-close = ws %x7D ; }
|
||||||
|
//inline-table-sep = ws %x2C ws ; , Comma
|
||||||
|
//inline-table-keyvals = keyval [ inline-table-sep inline-table-keyvals ]
|
||||||
|
|
||||||
|
b = b[1:]
|
||||||
|
|
||||||
|
first := true
|
||||||
|
var err error
|
||||||
|
for len(b) > 0 {
|
||||||
|
b = p.parseWhitespace(b)
|
||||||
|
if b[0] == '}' {
|
||||||
|
break
|
||||||
|
}
|
||||||
|
|
||||||
|
if !first {
|
||||||
|
b, err = expect(',', b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
b = p.parseWhitespace(b)
|
||||||
|
}
|
||||||
|
b, err = p.parseKeyval(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
first = false
|
||||||
|
}
|
||||||
|
return expect('}', b)
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseValArray(b []byte) ([]byte, error) {
|
||||||
|
//array = array-open [ array-values ] ws-comment-newline array-close
|
||||||
|
//array-open = %x5B ; [
|
||||||
|
//array-close = %x5D ; ]
|
||||||
|
//array-values = ws-comment-newline val ws-comment-newline array-sep array-values
|
||||||
|
//array-values =/ ws-comment-newline val ws-comment-newline [ array-sep ]
|
||||||
|
//array-sep = %x2C ; , Comma
|
||||||
|
//ws-comment-newline = *( wschar / [ comment ] newline )
|
||||||
|
|
||||||
|
p.builder.ArrayBegin()
|
||||||
|
defer p.builder.ArrayEnd()
|
||||||
|
|
||||||
|
b = b[1:]
|
||||||
|
|
||||||
|
first := true
|
||||||
|
var err error
|
||||||
|
for len(b) > 0 {
|
||||||
|
b, err = p.parseOptionalWhitespaceCommentNewline(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
if len(b) == 0 {
|
||||||
|
return nil, unexpectedCharacter{b: b}
|
||||||
|
}
|
||||||
|
|
||||||
|
if b[0] == ']' {
|
||||||
|
break
|
||||||
|
}
|
||||||
|
if b[0] == ',' {
|
||||||
|
if first {
|
||||||
|
return nil, fmt.Errorf("array cannot start with comma")
|
||||||
|
}
|
||||||
|
b = b[1:]
|
||||||
|
b, err = p.parseOptionalWhitespaceCommentNewline(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
b, err = p.parseVal(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
b, err = p.parseOptionalWhitespaceCommentNewline(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
first = false
|
||||||
|
}
|
||||||
|
|
||||||
|
return expect(']', b)
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseOptionalWhitespaceCommentNewline(b []byte) ([]byte, error) {
|
||||||
|
var err error
|
||||||
|
b = p.parseWhitespace(b)
|
||||||
|
if len(b) > 0 && b[0] == '#' {
|
||||||
|
_, b, err = scanComment(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
}
|
||||||
|
if len(b) > 0 && (b[0] == '\n' || b[0] == '\r') {
|
||||||
|
b, err = p.parseNewline(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
}
|
||||||
|
return b, nil
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseMultilineLiteralString(b []byte) ([]byte, []byte, error) {
|
||||||
|
token, rest, err := scanMultilineLiteralString(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
i := 3
|
||||||
|
|
||||||
|
// skip the immediate new line
|
||||||
|
if token[i] == '\n' {
|
||||||
|
i++
|
||||||
|
} else if token[i] == '\r' && token[i+1] == '\n' {
|
||||||
|
i += 2
|
||||||
|
}
|
||||||
|
|
||||||
|
return token[i : len(b)-3], rest, err
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseMultilineBasicString(b []byte) ([]byte, []byte, error) {
|
||||||
|
//ml-basic-string = ml-basic-string-delim [ newline ] ml-basic-body
|
||||||
|
//ml-basic-string-delim
|
||||||
|
//ml-basic-string-delim = 3quotation-mark
|
||||||
|
//ml-basic-body = *mlb-content *( mlb-quotes 1*mlb-content ) [ mlb-quotes ]
|
||||||
|
//
|
||||||
|
//mlb-content = mlb-char / newline / mlb-escaped-nl
|
||||||
|
//mlb-char = mlb-unescaped / escaped
|
||||||
|
//mlb-quotes = 1*2quotation-mark
|
||||||
|
//mlb-unescaped = wschar / %x21 / %x23-5B / %x5D-7E / non-ascii
|
||||||
|
//mlb-escaped-nl = escape ws newline *( wschar / newline )
|
||||||
|
|
||||||
|
token, rest, err := scanMultilineBasicString(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, nil, err
|
||||||
|
}
|
||||||
|
var builder bytes.Buffer
|
||||||
|
|
||||||
|
i := 3
|
||||||
|
|
||||||
|
// skip the immediate new line
|
||||||
|
if token[i] == '\n' {
|
||||||
|
i++
|
||||||
|
} else if token[i] == '\r' && token[i+1] == '\n' {
|
||||||
|
i += 2
|
||||||
|
}
|
||||||
|
|
||||||
|
// The scanner ensures that the token starts and ends with quotes and that
|
||||||
|
// escapes are balanced.
|
||||||
|
for ; i < len(token)-3; i++ {
|
||||||
|
c := token[i]
|
||||||
|
if c == '\\' {
|
||||||
|
// When the last non-whitespace character on a line is an unescaped \,
|
||||||
|
// it will be trimmed along with all whitespace (including newlines) up
|
||||||
|
// to the next non-whitespace character or closing delimiter.
|
||||||
|
if token[i+1] == '\n' || (token[i+1] == '\r' && token[i+2] == '\n') {
|
||||||
|
i++ // skip the \
|
||||||
|
for ; i < len(token)-3; i++ {
|
||||||
|
c := token[i]
|
||||||
|
if !(c == '\n' || c == '\r' || c == ' ' || c == '\t') {
|
||||||
|
break
|
||||||
|
}
|
||||||
|
}
|
||||||
|
continue
|
||||||
|
}
|
||||||
|
|
||||||
|
// handle escaping
|
||||||
|
i++
|
||||||
|
c = token[i]
|
||||||
|
switch c {
|
||||||
|
case '"', '\\':
|
||||||
|
builder.WriteByte(c)
|
||||||
|
case 'b':
|
||||||
|
builder.WriteByte('\b')
|
||||||
|
case 'f':
|
||||||
|
builder.WriteByte('\f')
|
||||||
|
case 'n':
|
||||||
|
builder.WriteByte('\n')
|
||||||
|
case 'r':
|
||||||
|
builder.WriteByte('\r')
|
||||||
|
case 't':
|
||||||
|
builder.WriteByte('\t')
|
||||||
|
case 'u':
|
||||||
|
x, err := hexToString(token[i+3:len(token)-3], 4)
|
||||||
|
if err != nil {
|
||||||
|
return nil, nil, err
|
||||||
|
}
|
||||||
|
builder.WriteString(x)
|
||||||
|
i += 4
|
||||||
|
case 'U':
|
||||||
|
x, err := hexToString(token[i+3:len(token)-3], 8)
|
||||||
|
if err != nil {
|
||||||
|
return nil, nil, err
|
||||||
|
}
|
||||||
|
builder.WriteString(x)
|
||||||
|
i += 8
|
||||||
|
default:
|
||||||
|
return nil, nil, fmt.Errorf("invalid escaped character: %#U", c)
|
||||||
|
}
|
||||||
|
} else {
|
||||||
|
builder.WriteByte(c)
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
return builder.Bytes(), rest, nil
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseKey(b []byte) ([]byte, error) {
|
||||||
|
//key = simple-key / dotted-key
|
||||||
|
//simple-key = quoted-key / unquoted-key
|
||||||
|
//
|
||||||
|
//unquoted-key = 1*( ALPHA / DIGIT / %x2D / %x5F ) ; A-Z / a-z / 0-9 / - / _
|
||||||
|
//quoted-key = basic-string / literal-string
|
||||||
|
//dotted-key = simple-key 1*( dot-sep simple-key )
|
||||||
|
//
|
||||||
|
//dot-sep = ws %x2E ws ; . Period
|
||||||
|
|
||||||
|
b, err := p.parseSimpleKey(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
for {
|
||||||
|
b = p.parseWhitespace(b)
|
||||||
|
if len(b) > 0 && b[0] == '.' {
|
||||||
|
b, err = expect('.', b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
b = p.parseWhitespace(b)
|
||||||
|
b, err = p.parseSimpleKey(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
} else {
|
||||||
|
break
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
return b, nil
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseSimpleKey(b []byte) (rest []byte, err error) {
|
||||||
|
//simple-key = quoted-key / unquoted-key
|
||||||
|
//unquoted-key = 1*( ALPHA / DIGIT / %x2D / %x5F ) ; A-Z / a-z / 0-9 / - / _
|
||||||
|
//quoted-key = basic-string / literal-string
|
||||||
|
|
||||||
|
if len(b) == 0 {
|
||||||
|
return nil, unexpectedCharacter{b: b}
|
||||||
|
}
|
||||||
|
|
||||||
|
var v []byte
|
||||||
|
if b[0] == '\'' {
|
||||||
|
v, rest, err = scanLiteralString(b)
|
||||||
|
} else if b[0] == '"' {
|
||||||
|
v, rest, err = p.parseBasicString(b)
|
||||||
|
} else if isUnquotedKeyChar(b[0]) {
|
||||||
|
v, rest, err = scanUnquotedKey(b)
|
||||||
|
} else {
|
||||||
|
return nil, unexpectedCharacter{b: b}
|
||||||
|
}
|
||||||
|
p.builder.SimpleKey(v)
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseBasicString(b []byte) ([]byte, []byte, error) {
|
||||||
|
//basic-string = quotation-mark *basic-char quotation-mark
|
||||||
|
//quotation-mark = %x22 ; "
|
||||||
|
//basic-char = basic-unescaped / escaped
|
||||||
|
//basic-unescaped = wschar / %x21 / %x23-5B / %x5D-7E / non-ascii
|
||||||
|
//escaped = escape escape-seq-char
|
||||||
|
//escape-seq-char = %x22 ; " quotation mark U+0022
|
||||||
|
//escape-seq-char =/ %x5C ; \ reverse solidus U+005C
|
||||||
|
//escape-seq-char =/ %x62 ; b backspace U+0008
|
||||||
|
//escape-seq-char =/ %x66 ; f form feed U+000C
|
||||||
|
//escape-seq-char =/ %x6E ; n line feed U+000A
|
||||||
|
//escape-seq-char =/ %x72 ; r carriage return U+000D
|
||||||
|
//escape-seq-char =/ %x74 ; t tab U+0009
|
||||||
|
//escape-seq-char =/ %x75 4HEXDIG ; uXXXX U+XXXX
|
||||||
|
//escape-seq-char =/ %x55 8HEXDIG ; UXXXXXXXX U+XXXXXXXX
|
||||||
|
|
||||||
|
token, rest, err := scanBasicString(b)
|
||||||
|
if err != nil {
|
||||||
|
return nil, nil, err
|
||||||
|
}
|
||||||
|
var builder bytes.Buffer
|
||||||
|
|
||||||
|
// The scanner ensures that the token starts and ends with quotes and that
|
||||||
|
// escapes are balanced.
|
||||||
|
for i := 1; i < len(token)-1; i++ {
|
||||||
|
c := token[i]
|
||||||
|
if c == '\\' {
|
||||||
|
i++
|
||||||
|
c = token[i]
|
||||||
|
switch c {
|
||||||
|
case '"', '\\':
|
||||||
|
builder.WriteByte(c)
|
||||||
|
case 'b':
|
||||||
|
builder.WriteByte('\b')
|
||||||
|
case 'f':
|
||||||
|
builder.WriteByte('\f')
|
||||||
|
case 'n':
|
||||||
|
builder.WriteByte('\n')
|
||||||
|
case 'r':
|
||||||
|
builder.WriteByte('\r')
|
||||||
|
case 't':
|
||||||
|
builder.WriteByte('\t')
|
||||||
|
case 'u':
|
||||||
|
x, err := hexToString(token[i+1:len(token)-1], 4)
|
||||||
|
if err != nil {
|
||||||
|
return nil, nil, err
|
||||||
|
}
|
||||||
|
builder.WriteString(x)
|
||||||
|
i += 4
|
||||||
|
case 'U':
|
||||||
|
x, err := hexToString(token[i+1:len(token)-1], 8)
|
||||||
|
if err != nil {
|
||||||
|
return nil, nil, err
|
||||||
|
}
|
||||||
|
builder.WriteString(x)
|
||||||
|
i += 8
|
||||||
|
default:
|
||||||
|
return nil, nil, fmt.Errorf("invalid escaped character: %#U", c)
|
||||||
|
}
|
||||||
|
} else {
|
||||||
|
builder.WriteByte(c)
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
return builder.Bytes(), rest, nil
|
||||||
|
}
|
||||||
|
|
||||||
|
func hexToString(b []byte, length int) (string, error) {
|
||||||
|
if len(b) < length {
|
||||||
|
return "", fmt.Errorf("unicode point needs %d hex characters", length)
|
||||||
|
}
|
||||||
|
// TODO: slow
|
||||||
|
b, err := hex.DecodeString(string(b[:length]))
|
||||||
|
if err != nil {
|
||||||
|
return "", err
|
||||||
|
}
|
||||||
|
return string(b), nil
|
||||||
|
}
|
||||||
|
|
||||||
|
func (p parser) parseWhitespace(b []byte) []byte {
|
||||||
|
//ws = *wschar
|
||||||
|
//wschar = %x20 ; Space
|
||||||
|
//wschar =/ %x09 ; Horizontal tab
|
||||||
|
|
||||||
|
_, rest := scanWhitespace(b)
|
||||||
|
return rest
|
||||||
|
}
|
||||||
|
|
||||||
|
func expect(x byte, b []byte) ([]byte, error) {
|
||||||
|
if len(b) == 0 || b[0] != x {
|
||||||
|
return nil, unexpectedCharacter{r: x, b: b}
|
||||||
|
}
|
||||||
|
return b[1:], nil
|
||||||
|
}
|
||||||
|
|
||||||
|
type unexpectedCharacter struct {
|
||||||
|
r byte
|
||||||
|
b []byte
|
||||||
|
}
|
||||||
|
|
||||||
|
func (u unexpectedCharacter) Error() string {
|
||||||
|
if len(u.b) == 0 {
|
||||||
|
return fmt.Sprintf("expected %#U, not EOF", u.r)
|
||||||
|
|
||||||
|
}
|
||||||
|
return fmt.Sprintf("expected %#U, not %#U", u.r, u.b[0])
|
||||||
|
}
|
||||||
|
|||||||
-611
@@ -1,9 +1,6 @@
|
|||||||
package toml
|
package toml
|
||||||
|
|
||||||
import (
|
import (
|
||||||
"bytes"
|
|
||||||
"encoding/hex"
|
|
||||||
"fmt"
|
|
||||||
"reflect"
|
"reflect"
|
||||||
|
|
||||||
"github.com/pelletier/go-toml/v2/internal/reflectbuild"
|
"github.com/pelletier/go-toml/v2/internal/reflectbuild"
|
||||||
@@ -172,611 +169,3 @@ func (u *unmarshaler) StandardTableEnd() {
|
|||||||
return
|
return
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
|
|
||||||
type builder interface {
|
|
||||||
SimpleKey(v []byte)
|
|
||||||
|
|
||||||
StandardTableBegin()
|
|
||||||
StandardTableEnd()
|
|
||||||
ArrayTableBegin()
|
|
||||||
ArrayTableEnd()
|
|
||||||
KeyValBegin()
|
|
||||||
KeyValEnd()
|
|
||||||
ArrayBegin()
|
|
||||||
ArrayEnd()
|
|
||||||
Assignation()
|
|
||||||
|
|
||||||
StringValue(v []byte)
|
|
||||||
BoolValue(b bool)
|
|
||||||
}
|
|
||||||
|
|
||||||
type parser struct {
|
|
||||||
builder builder
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parse(b []byte) error {
|
|
||||||
b, err := p.parseExpression(b)
|
|
||||||
if err != nil {
|
|
||||||
return err
|
|
||||||
}
|
|
||||||
for len(b) > 0 {
|
|
||||||
b, err = p.parseNewline(b)
|
|
||||||
if err != nil {
|
|
||||||
return err
|
|
||||||
}
|
|
||||||
|
|
||||||
b, err = p.parseExpression(b)
|
|
||||||
if err != nil {
|
|
||||||
return err
|
|
||||||
}
|
|
||||||
}
|
|
||||||
return nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseNewline(b []byte) ([]byte, error) {
|
|
||||||
if b[0] == '\n' {
|
|
||||||
return b[1:], nil
|
|
||||||
}
|
|
||||||
if b[0] == '\r' {
|
|
||||||
_, rest, err := scanWindowsNewline(b)
|
|
||||||
return rest, err
|
|
||||||
}
|
|
||||||
return nil, fmt.Errorf("expected newline but got %#U", b[0])
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseExpression(b []byte) ([]byte, error) {
|
|
||||||
//expression = ws [ comment ]
|
|
||||||
//expression =/ ws keyval ws [ comment ]
|
|
||||||
//expression =/ ws table ws [ comment ]
|
|
||||||
|
|
||||||
b = p.parseWhitespace(b)
|
|
||||||
|
|
||||||
if len(b) == 0 {
|
|
||||||
return b, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
if b[0] == '#' {
|
|
||||||
_, rest, err := scanComment(b)
|
|
||||||
return rest, err
|
|
||||||
}
|
|
||||||
if b[0] == '\n' || b[0] == '\r' {
|
|
||||||
return b, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
var err error
|
|
||||||
if b[0] == '[' {
|
|
||||||
b, err = p.parseTable(b)
|
|
||||||
} else {
|
|
||||||
b, err = p.parseKeyval(b)
|
|
||||||
}
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
b = p.parseWhitespace(b)
|
|
||||||
|
|
||||||
if len(b) > 0 && b[0] == '#' {
|
|
||||||
_, rest, err := scanComment(b)
|
|
||||||
return rest, err
|
|
||||||
}
|
|
||||||
|
|
||||||
return b, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseTable(b []byte) ([]byte, error) {
|
|
||||||
//table = std-table / array-table
|
|
||||||
if len(b) > 1 && b[1] == '[' {
|
|
||||||
return p.parseArrayTable(b)
|
|
||||||
}
|
|
||||||
return p.parseStdTable(b)
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseArrayTable(b []byte) ([]byte, error) {
|
|
||||||
//array-table = array-table-open key array-table-close
|
|
||||||
//array-table-open = %x5B.5B ws ; [[ Double left square bracket
|
|
||||||
//array-table-close = ws %x5D.5D ; ]] Double right square bracket
|
|
||||||
|
|
||||||
p.builder.ArrayTableBegin()
|
|
||||||
defer p.builder.ArrayTableEnd()
|
|
||||||
|
|
||||||
b = b[2:]
|
|
||||||
b = p.parseWhitespace(b)
|
|
||||||
b, err := p.parseKey(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
b = p.parseWhitespace(b)
|
|
||||||
b, err = expect(']', b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
return expect(']', b)
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseStdTable(b []byte) ([]byte, error) {
|
|
||||||
//std-table = std-table-open key std-table-close
|
|
||||||
//std-table-open = %x5B ws ; [ Left square bracket
|
|
||||||
//std-table-close = ws %x5D ; ] Right square bracket
|
|
||||||
|
|
||||||
p.builder.StandardTableBegin()
|
|
||||||
defer p.builder.StandardTableEnd()
|
|
||||||
|
|
||||||
b = b[1:]
|
|
||||||
b = p.parseWhitespace(b)
|
|
||||||
b, err := p.parseKey(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
b = p.parseWhitespace(b)
|
|
||||||
|
|
||||||
return expect(']', b)
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseKeyval(b []byte) ([]byte, error) {
|
|
||||||
//keyval = key keyval-sep val
|
|
||||||
|
|
||||||
p.builder.KeyValBegin()
|
|
||||||
defer p.builder.KeyValEnd()
|
|
||||||
|
|
||||||
b, err := p.parseKey(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
//keyval-sep = ws %x3D ws ; =
|
|
||||||
|
|
||||||
b = p.parseWhitespace(b)
|
|
||||||
b, err = expect('=', b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
p.builder.Assignation()
|
|
||||||
b = p.parseWhitespace(b)
|
|
||||||
|
|
||||||
return p.parseVal(b)
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseVal(b []byte) ([]byte, error) {
|
|
||||||
// val = string / boolean / array / inline-table / date-time / float / integer
|
|
||||||
if len(b) == 0 {
|
|
||||||
return nil, fmt.Errorf("expected value, not eof")
|
|
||||||
}
|
|
||||||
|
|
||||||
var err error
|
|
||||||
c := b[0]
|
|
||||||
|
|
||||||
switch c {
|
|
||||||
// strings
|
|
||||||
case '"':
|
|
||||||
var v []byte
|
|
||||||
if scanFollowsMultilineBasicStringDelimiter(b) {
|
|
||||||
v, b, err = p.parseMultilineBasicString(b)
|
|
||||||
} else {
|
|
||||||
v, b, err = p.parseBasicString(b)
|
|
||||||
}
|
|
||||||
if err == nil {
|
|
||||||
p.builder.StringValue(v)
|
|
||||||
}
|
|
||||||
return b, err
|
|
||||||
case '\'':
|
|
||||||
var v []byte
|
|
||||||
if scanFollowsMultilineLiteralStringDelimiter(b) {
|
|
||||||
v, b, err = p.parseMultilineLiteralString(b)
|
|
||||||
} else {
|
|
||||||
v, b, err = p.parseLiteralString(b)
|
|
||||||
}
|
|
||||||
if err == nil {
|
|
||||||
p.builder.StringValue(v)
|
|
||||||
}
|
|
||||||
return b, err
|
|
||||||
case 't':
|
|
||||||
if !scanFollowsTrue(b) {
|
|
||||||
return nil, fmt.Errorf("expected 'true'")
|
|
||||||
}
|
|
||||||
p.builder.BoolValue(true)
|
|
||||||
return b[4:], nil
|
|
||||||
case 'f':
|
|
||||||
if !scanFollowsFalse(b) {
|
|
||||||
return nil, fmt.Errorf("expected 'false'")
|
|
||||||
}
|
|
||||||
p.builder.BoolValue(false)
|
|
||||||
return b[5:], nil
|
|
||||||
case '[':
|
|
||||||
return p.parseValArray(b)
|
|
||||||
case '{':
|
|
||||||
return p.parseInlineTable(b)
|
|
||||||
|
|
||||||
// TODO date-time
|
|
||||||
|
|
||||||
// TODO float
|
|
||||||
|
|
||||||
// TODO integer
|
|
||||||
default:
|
|
||||||
return nil, fmt.Errorf("unexpected char")
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseLiteralString(b []byte) ([]byte, []byte, error) {
|
|
||||||
v, rest, err := scanLiteralString(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, nil, err
|
|
||||||
}
|
|
||||||
return v[1 : len(v)-1], rest, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseInlineTable(b []byte) ([]byte, error) {
|
|
||||||
//inline-table = inline-table-open [ inline-table-keyvals ] inline-table-close
|
|
||||||
//inline-table-open = %x7B ws ; {
|
|
||||||
//inline-table-close = ws %x7D ; }
|
|
||||||
//inline-table-sep = ws %x2C ws ; , Comma
|
|
||||||
//inline-table-keyvals = keyval [ inline-table-sep inline-table-keyvals ]
|
|
||||||
|
|
||||||
b = b[1:]
|
|
||||||
|
|
||||||
first := true
|
|
||||||
var err error
|
|
||||||
for len(b) > 0 {
|
|
||||||
b = p.parseWhitespace(b)
|
|
||||||
if b[0] == '}' {
|
|
||||||
break
|
|
||||||
}
|
|
||||||
|
|
||||||
if !first {
|
|
||||||
b, err = expect(',', b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
b = p.parseWhitespace(b)
|
|
||||||
}
|
|
||||||
b, err = p.parseKeyval(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
first = false
|
|
||||||
}
|
|
||||||
return expect('}', b)
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseValArray(b []byte) ([]byte, error) {
|
|
||||||
//array = array-open [ array-values ] ws-comment-newline array-close
|
|
||||||
//array-open = %x5B ; [
|
|
||||||
//array-close = %x5D ; ]
|
|
||||||
//array-values = ws-comment-newline val ws-comment-newline array-sep array-values
|
|
||||||
//array-values =/ ws-comment-newline val ws-comment-newline [ array-sep ]
|
|
||||||
//array-sep = %x2C ; , Comma
|
|
||||||
//ws-comment-newline = *( wschar / [ comment ] newline )
|
|
||||||
|
|
||||||
p.builder.ArrayBegin()
|
|
||||||
defer p.builder.ArrayEnd()
|
|
||||||
|
|
||||||
b = b[1:]
|
|
||||||
|
|
||||||
first := true
|
|
||||||
var err error
|
|
||||||
for len(b) > 0 {
|
|
||||||
b, err = p.parseOptionalWhitespaceCommentNewline(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
if len(b) == 0 {
|
|
||||||
return nil, unexpectedCharacter{b: b}
|
|
||||||
}
|
|
||||||
|
|
||||||
if b[0] == ']' {
|
|
||||||
break
|
|
||||||
}
|
|
||||||
if b[0] == ',' {
|
|
||||||
if first {
|
|
||||||
return nil, fmt.Errorf("array cannot start with comma")
|
|
||||||
}
|
|
||||||
b = b[1:]
|
|
||||||
b, err = p.parseOptionalWhitespaceCommentNewline(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
b, err = p.parseVal(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
b, err = p.parseOptionalWhitespaceCommentNewline(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
first = false
|
|
||||||
}
|
|
||||||
|
|
||||||
return expect(']', b)
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseOptionalWhitespaceCommentNewline(b []byte) ([]byte, error) {
|
|
||||||
var err error
|
|
||||||
b = p.parseWhitespace(b)
|
|
||||||
if len(b) > 0 && b[0] == '#' {
|
|
||||||
_, b, err = scanComment(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
}
|
|
||||||
if len(b) > 0 && (b[0] == '\n' || b[0] == '\r') {
|
|
||||||
b, err = p.parseNewline(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
}
|
|
||||||
return b, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseMultilineLiteralString(b []byte) ([]byte, []byte, error) {
|
|
||||||
token, rest, err := scanMultilineLiteralString(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
i := 3
|
|
||||||
|
|
||||||
// skip the immediate new line
|
|
||||||
if token[i] == '\n' {
|
|
||||||
i++
|
|
||||||
} else if token[i] == '\r' && token[i+1] == '\n' {
|
|
||||||
i += 2
|
|
||||||
}
|
|
||||||
|
|
||||||
return token[i : len(b)-3], rest, err
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseMultilineBasicString(b []byte) ([]byte, []byte, error) {
|
|
||||||
//ml-basic-string = ml-basic-string-delim [ newline ] ml-basic-body
|
|
||||||
//ml-basic-string-delim
|
|
||||||
//ml-basic-string-delim = 3quotation-mark
|
|
||||||
//ml-basic-body = *mlb-content *( mlb-quotes 1*mlb-content ) [ mlb-quotes ]
|
|
||||||
//
|
|
||||||
//mlb-content = mlb-char / newline / mlb-escaped-nl
|
|
||||||
//mlb-char = mlb-unescaped / escaped
|
|
||||||
//mlb-quotes = 1*2quotation-mark
|
|
||||||
//mlb-unescaped = wschar / %x21 / %x23-5B / %x5D-7E / non-ascii
|
|
||||||
//mlb-escaped-nl = escape ws newline *( wschar / newline )
|
|
||||||
|
|
||||||
token, rest, err := scanMultilineBasicString(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, nil, err
|
|
||||||
}
|
|
||||||
var builder bytes.Buffer
|
|
||||||
|
|
||||||
i := 3
|
|
||||||
|
|
||||||
// skip the immediate new line
|
|
||||||
if token[i] == '\n' {
|
|
||||||
i++
|
|
||||||
} else if token[i] == '\r' && token[i+1] == '\n' {
|
|
||||||
i += 2
|
|
||||||
}
|
|
||||||
|
|
||||||
// The scanner ensures that the token starts and ends with quotes and that
|
|
||||||
// escapes are balanced.
|
|
||||||
for ; i < len(token)-3; i++ {
|
|
||||||
c := token[i]
|
|
||||||
if c == '\\' {
|
|
||||||
// When the last non-whitespace character on a line is an unescaped \,
|
|
||||||
// it will be trimmed along with all whitespace (including newlines) up
|
|
||||||
// to the next non-whitespace character or closing delimiter.
|
|
||||||
if token[i+1] == '\n' || (token[i+1] == '\r' && token[i+2] == '\n') {
|
|
||||||
i++ // skip the \
|
|
||||||
for ; i < len(token)-3; i++ {
|
|
||||||
c := token[i]
|
|
||||||
if !(c == '\n' || c == '\r' || c == ' ' || c == '\t') {
|
|
||||||
break
|
|
||||||
}
|
|
||||||
}
|
|
||||||
continue
|
|
||||||
}
|
|
||||||
|
|
||||||
// handle escaping
|
|
||||||
i++
|
|
||||||
c = token[i]
|
|
||||||
switch c {
|
|
||||||
case '"', '\\':
|
|
||||||
builder.WriteByte(c)
|
|
||||||
case 'b':
|
|
||||||
builder.WriteByte('\b')
|
|
||||||
case 'f':
|
|
||||||
builder.WriteByte('\f')
|
|
||||||
case 'n':
|
|
||||||
builder.WriteByte('\n')
|
|
||||||
case 'r':
|
|
||||||
builder.WriteByte('\r')
|
|
||||||
case 't':
|
|
||||||
builder.WriteByte('\t')
|
|
||||||
case 'u':
|
|
||||||
x, err := hexToString(token[i+3:len(token)-3], 4)
|
|
||||||
if err != nil {
|
|
||||||
return nil, nil, err
|
|
||||||
}
|
|
||||||
builder.WriteString(x)
|
|
||||||
i += 4
|
|
||||||
case 'U':
|
|
||||||
x, err := hexToString(token[i+3:len(token)-3], 8)
|
|
||||||
if err != nil {
|
|
||||||
return nil, nil, err
|
|
||||||
}
|
|
||||||
builder.WriteString(x)
|
|
||||||
i += 8
|
|
||||||
default:
|
|
||||||
return nil, nil, fmt.Errorf("invalid escaped character: %#U", c)
|
|
||||||
}
|
|
||||||
} else {
|
|
||||||
builder.WriteByte(c)
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
return builder.Bytes(), rest, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseKey(b []byte) ([]byte, error) {
|
|
||||||
//key = simple-key / dotted-key
|
|
||||||
//simple-key = quoted-key / unquoted-key
|
|
||||||
//
|
|
||||||
//unquoted-key = 1*( ALPHA / DIGIT / %x2D / %x5F ) ; A-Z / a-z / 0-9 / - / _
|
|
||||||
//quoted-key = basic-string / literal-string
|
|
||||||
//dotted-key = simple-key 1*( dot-sep simple-key )
|
|
||||||
//
|
|
||||||
//dot-sep = ws %x2E ws ; . Period
|
|
||||||
|
|
||||||
b, err := p.parseSimpleKey(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
|
|
||||||
for {
|
|
||||||
b = p.parseWhitespace(b)
|
|
||||||
if len(b) > 0 && b[0] == '.' {
|
|
||||||
b, err = expect('.', b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
b = p.parseWhitespace(b)
|
|
||||||
b, err = p.parseSimpleKey(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, err
|
|
||||||
}
|
|
||||||
} else {
|
|
||||||
break
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
return b, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseSimpleKey(b []byte) (rest []byte, err error) {
|
|
||||||
//simple-key = quoted-key / unquoted-key
|
|
||||||
//unquoted-key = 1*( ALPHA / DIGIT / %x2D / %x5F ) ; A-Z / a-z / 0-9 / - / _
|
|
||||||
//quoted-key = basic-string / literal-string
|
|
||||||
|
|
||||||
if len(b) == 0 {
|
|
||||||
return nil, unexpectedCharacter{b: b}
|
|
||||||
}
|
|
||||||
|
|
||||||
var v []byte
|
|
||||||
if b[0] == '\'' {
|
|
||||||
v, rest, err = scanLiteralString(b)
|
|
||||||
} else if b[0] == '"' {
|
|
||||||
v, rest, err = p.parseBasicString(b)
|
|
||||||
} else if isUnquotedKeyChar(b[0]) {
|
|
||||||
v, rest, err = scanUnquotedKey(b)
|
|
||||||
} else {
|
|
||||||
return nil, unexpectedCharacter{b: b}
|
|
||||||
}
|
|
||||||
p.builder.SimpleKey(v)
|
|
||||||
return
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseBasicString(b []byte) ([]byte, []byte, error) {
|
|
||||||
//basic-string = quotation-mark *basic-char quotation-mark
|
|
||||||
//quotation-mark = %x22 ; "
|
|
||||||
//basic-char = basic-unescaped / escaped
|
|
||||||
//basic-unescaped = wschar / %x21 / %x23-5B / %x5D-7E / non-ascii
|
|
||||||
//escaped = escape escape-seq-char
|
|
||||||
//escape-seq-char = %x22 ; " quotation mark U+0022
|
|
||||||
//escape-seq-char =/ %x5C ; \ reverse solidus U+005C
|
|
||||||
//escape-seq-char =/ %x62 ; b backspace U+0008
|
|
||||||
//escape-seq-char =/ %x66 ; f form feed U+000C
|
|
||||||
//escape-seq-char =/ %x6E ; n line feed U+000A
|
|
||||||
//escape-seq-char =/ %x72 ; r carriage return U+000D
|
|
||||||
//escape-seq-char =/ %x74 ; t tab U+0009
|
|
||||||
//escape-seq-char =/ %x75 4HEXDIG ; uXXXX U+XXXX
|
|
||||||
//escape-seq-char =/ %x55 8HEXDIG ; UXXXXXXXX U+XXXXXXXX
|
|
||||||
|
|
||||||
token, rest, err := scanBasicString(b)
|
|
||||||
if err != nil {
|
|
||||||
return nil, nil, err
|
|
||||||
}
|
|
||||||
var builder bytes.Buffer
|
|
||||||
|
|
||||||
// The scanner ensures that the token starts and ends with quotes and that
|
|
||||||
// escapes are balanced.
|
|
||||||
for i := 1; i < len(token)-1; i++ {
|
|
||||||
c := token[i]
|
|
||||||
if c == '\\' {
|
|
||||||
i++
|
|
||||||
c = token[i]
|
|
||||||
switch c {
|
|
||||||
case '"', '\\':
|
|
||||||
builder.WriteByte(c)
|
|
||||||
case 'b':
|
|
||||||
builder.WriteByte('\b')
|
|
||||||
case 'f':
|
|
||||||
builder.WriteByte('\f')
|
|
||||||
case 'n':
|
|
||||||
builder.WriteByte('\n')
|
|
||||||
case 'r':
|
|
||||||
builder.WriteByte('\r')
|
|
||||||
case 't':
|
|
||||||
builder.WriteByte('\t')
|
|
||||||
case 'u':
|
|
||||||
x, err := hexToString(token[i+1:len(token)-1], 4)
|
|
||||||
if err != nil {
|
|
||||||
return nil, nil, err
|
|
||||||
}
|
|
||||||
builder.WriteString(x)
|
|
||||||
i += 4
|
|
||||||
case 'U':
|
|
||||||
x, err := hexToString(token[i+1:len(token)-1], 8)
|
|
||||||
if err != nil {
|
|
||||||
return nil, nil, err
|
|
||||||
}
|
|
||||||
builder.WriteString(x)
|
|
||||||
i += 8
|
|
||||||
default:
|
|
||||||
return nil, nil, fmt.Errorf("invalid escaped character: %#U", c)
|
|
||||||
}
|
|
||||||
} else {
|
|
||||||
builder.WriteByte(c)
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
return builder.Bytes(), rest, nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func hexToString(b []byte, length int) (string, error) {
|
|
||||||
if len(b) < length {
|
|
||||||
return "", fmt.Errorf("unicode point needs %d hex characters", length)
|
|
||||||
}
|
|
||||||
// TODO: slow
|
|
||||||
b, err := hex.DecodeString(string(b[:length]))
|
|
||||||
if err != nil {
|
|
||||||
return "", err
|
|
||||||
}
|
|
||||||
return string(b), nil
|
|
||||||
}
|
|
||||||
|
|
||||||
func (p parser) parseWhitespace(b []byte) []byte {
|
|
||||||
//ws = *wschar
|
|
||||||
//wschar = %x20 ; Space
|
|
||||||
//wschar =/ %x09 ; Horizontal tab
|
|
||||||
|
|
||||||
_, rest := scanWhitespace(b)
|
|
||||||
return rest
|
|
||||||
}
|
|
||||||
|
|
||||||
func expect(x byte, b []byte) ([]byte, error) {
|
|
||||||
if len(b) == 0 || b[0] != x {
|
|
||||||
return nil, unexpectedCharacter{r: x, b: b}
|
|
||||||
}
|
|
||||||
return b[1:], nil
|
|
||||||
}
|
|
||||||
|
|
||||||
type unexpectedCharacter struct {
|
|
||||||
r byte
|
|
||||||
b []byte
|
|
||||||
}
|
|
||||||
|
|
||||||
func (u unexpectedCharacter) Error() string {
|
|
||||||
if len(u.b) == 0 {
|
|
||||||
return fmt.Sprintf("expected %#U, not EOF", u.r)
|
|
||||||
|
|
||||||
}
|
|
||||||
return fmt.Sprintf("expected %#U, not %#U", u.r, u.b[0])
|
|
||||||
}
|
|
||||||
|
|||||||
Reference in New Issue
Block a user