rfc7230.ipp 14 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390
  1. //
  2. // Copyright (c) 2016-2019 Vinnie Falco (vinnie dot falco at gmail dot com)
  3. //
  4. // Distributed under the Boost Software License, Version 1.0. (See accompanying
  5. // file LICENSE_1_0.txt or copy at http://www.boost.org/LICENSE_1_0.txt)
  6. //
  7. // Official repository: https://github.com/boostorg/beast
  8. //
  9. #ifndef BOOST_BEAST_HTTP_DETAIL_RFC7230_IPP
  10. #define BOOST_BEAST_HTTP_DETAIL_RFC7230_IPP
  11. #include <boost/beast/core/string.hpp>
  12. #include <iterator>
  13. #include <utility>
  14. namespace boost {
  15. namespace beast {
  16. namespace http {
  17. namespace detail {
  18. bool
  19. is_digit(char c)
  20. {
  21. return c >= '0' && c <= '9';
  22. }
  23. char
  24. is_alpha(char c)
  25. {
  26. static char constexpr tab[] = {
  27. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 0
  28. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 16
  29. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 32
  30. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 48
  31. 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 64
  32. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, // 80
  33. 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 96
  34. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, // 112
  35. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 128
  36. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 144
  37. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 160
  38. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 176
  39. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 192
  40. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 208
  41. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 224
  42. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 // 240
  43. };
  44. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  45. return tab[static_cast<unsigned char>(c)];
  46. }
  47. char
  48. is_text(char c)
  49. {
  50. // TEXT = <any OCTET except CTLs, but including LWS>
  51. static char constexpr tab[] = {
  52. 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, // 0
  53. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 16
  54. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 32
  55. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 48
  56. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 64
  57. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 80
  58. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 96
  59. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, // 112
  60. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 128
  61. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 144
  62. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 160
  63. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 176
  64. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 192
  65. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 208
  66. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 224
  67. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1 // 240
  68. };
  69. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  70. return tab[static_cast<unsigned char>(c)];
  71. }
  72. char
  73. is_token_char(char c)
  74. {
  75. /*
  76. tchar = "!" | "#" | "$" | "%" | "&" |
  77. "'" | "*" | "+" | "-" | "." |
  78. "^" | "_" | "`" | "|" | "~" |
  79. DIGIT | ALPHA
  80. */
  81. static char constexpr tab[] = {
  82. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 0
  83. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 16
  84. 0, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 0, // 32
  85. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, // 48
  86. 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 64
  87. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 1, // 80
  88. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 96
  89. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, // 112
  90. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 128
  91. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 144
  92. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 160
  93. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 176
  94. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 192
  95. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 208
  96. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 224
  97. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 // 240
  98. };
  99. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  100. return tab[static_cast<unsigned char>(c)];
  101. }
  102. char
  103. is_qdchar(char c)
  104. {
  105. /*
  106. qdtext = HTAB / SP / "!" / %x23-5B ; '#'-'[' / %x5D-7E ; ']'-'~' / obs-text
  107. */
  108. static char constexpr tab[] = {
  109. 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, // 0
  110. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 16
  111. 1, 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 32
  112. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 48
  113. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 64
  114. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, // 80
  115. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 96
  116. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, // 112
  117. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 128
  118. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 144
  119. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 160
  120. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 176
  121. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 192
  122. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 208
  123. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 224
  124. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1 // 240
  125. };
  126. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  127. return tab[static_cast<unsigned char>(c)];
  128. }
  129. char
  130. is_qpchar(char c)
  131. {
  132. /*
  133. quoted-pair = "\" ( HTAB / SP / VCHAR / obs-text )
  134. obs-text = %x80-FF
  135. */
  136. static char constexpr tab[] = {
  137. 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, // 0
  138. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 16
  139. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 32
  140. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 48
  141. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 64
  142. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 80
  143. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 96
  144. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, // 112
  145. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 128
  146. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 144
  147. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 160
  148. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 176
  149. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 192
  150. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 208
  151. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, // 224
  152. 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1 // 240
  153. };
  154. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  155. return tab[static_cast<unsigned char>(c)];
  156. }
  157. // converts to lower case,
  158. // returns 0 if not a valid text char
  159. //
  160. char
  161. to_value_char(char c)
  162. {
  163. // TEXT = <any OCTET except CTLs, but including LWS>
  164. static unsigned char constexpr tab[] = {
  165. 0, 0, 0, 0, 0, 0, 0, 0, 0, 9, 0, 0, 0, 0, 0, 0, // 0
  166. 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, // 16
  167. 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, // 32
  168. 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, // 48
  169. 64, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, // 64
  170. 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 91, 92, 93, 94, 95, // 80
  171. 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, // 96
  172. 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 0, // 112
  173. 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, // 128
  174. 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, // 144
  175. 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, // 160
  176. 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, // 176
  177. 192, 193, 194, 195, 196, 197, 198, 199, 200, 201, 202, 203, 204, 205, 206, 207, // 192
  178. 208, 209, 210, 211, 212, 213, 214, 215, 216, 217, 218, 219, 220, 221, 222, 223, // 208
  179. 224, 225, 226, 227, 228, 229, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, // 224
  180. 240, 241, 242, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 255 // 240
  181. };
  182. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  183. return static_cast<char>(tab[static_cast<unsigned char>(c)]);
  184. }
  185. // VFALCO TODO Make this return unsigned?
  186. std::int8_t
  187. unhex(char c)
  188. {
  189. static signed char constexpr tab[] = {
  190. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 0
  191. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 16
  192. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 32
  193. 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, -1, -1, -1, -1, -1, -1, // 48
  194. -1, 10, 11, 12, 13, 14, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 64
  195. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 80
  196. -1, 10, 11, 12, 13, 14, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 96
  197. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 112
  198. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 128
  199. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 144
  200. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 160
  201. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 176
  202. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 192
  203. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 208
  204. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, // 224
  205. -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1 // 240
  206. };
  207. BOOST_STATIC_ASSERT(sizeof(tab) == 256);
  208. return tab[static_cast<unsigned char>(c)];
  209. }
  210. template <class ForwardIt>
  211. void
  212. skip_ows(ForwardIt& it, ForwardIt end)
  213. {
  214. while(it != end)
  215. {
  216. if(*it != ' ' && *it != '\t')
  217. break;
  218. ++it;
  219. }
  220. }
  221. template <class ForwardIt>
  222. void
  223. skip_token(ForwardIt& it, ForwardIt last)
  224. {
  225. while(it != last && is_token_char(*it))
  226. ++it;
  227. }
  228. string_view
  229. trim(string_view s)
  230. {
  231. auto first = s.begin();
  232. auto last = s.end();
  233. skip_ows(first, last);
  234. while(first != last)
  235. {
  236. auto const c = *std::prev(last);
  237. if(c != ' ' && c != '\t')
  238. break;
  239. --last;
  240. }
  241. if(first == last)
  242. return {};
  243. return {&*first,
  244. static_cast<std::size_t>(last - first)};
  245. }
  246. BOOST_BEAST_DECL
  247. void
  248. param_iter::
  249. increment()
  250. {
  251. /*
  252. param-list = *( OWS ";" OWS param )
  253. param = token OWS [ "=" OWS ( token / quoted-string ) ]
  254. quoted-string = DQUOTE *( qdtext / quoted-pair ) DQUOTE
  255. qdtext = HTAB / SP / "!" / %x23-5B ; '#'-'[' / %x5D-7E ; ']'-'~' / obs-text
  256. quoted-pair = "\" ( HTAB / SP / VCHAR / obs-text )
  257. obs-text = %x80-FF
  258. */
  259. auto const err =
  260. [&]
  261. {
  262. it = first;
  263. };
  264. v.first = {};
  265. v.second = {};
  266. detail::skip_ows(it, last);
  267. first = it;
  268. if(it == last)
  269. return err();
  270. if(*it != ';')
  271. return err();
  272. ++it;
  273. detail::skip_ows(it, last);
  274. if(it == last)
  275. return err();
  276. // param
  277. if(! detail::is_token_char(*it))
  278. return err();
  279. auto const p0 = it;
  280. skip_token(++it, last);
  281. auto const p1 = it;
  282. v.first = { &*p0, static_cast<std::size_t>(p1 - p0) };
  283. detail::skip_ows(it, last);
  284. if(it == last)
  285. return;
  286. if(*it == ';')
  287. return;
  288. if(*it != '=')
  289. return err();
  290. ++it;
  291. detail::skip_ows(it, last);
  292. if(it == last)
  293. return;
  294. if(*it == '"')
  295. {
  296. // quoted-string
  297. auto const p2 = it;
  298. ++it;
  299. for(;;)
  300. {
  301. if(it == last)
  302. return err();
  303. auto c = *it++;
  304. if(c == '"')
  305. break;
  306. if(detail::is_qdchar(c))
  307. continue;
  308. if(c != '\\')
  309. return err();
  310. if(it == last)
  311. return err();
  312. c = *it++;
  313. if(! detail::is_qpchar(c))
  314. return err();
  315. }
  316. v.second = { &*p2, static_cast<std::size_t>(it - p2) };
  317. }
  318. else
  319. {
  320. // token
  321. if(! detail::is_token_char(*it))
  322. return err();
  323. auto const p2 = it;
  324. skip_token(++it, last);
  325. v.second = { &*p2, static_cast<std::size_t>(it - p2) };
  326. }
  327. }
  328. bool
  329. opt_token_list_policy::operator()(value_type& v,
  330. char const*& it, string_view s) const
  331. {
  332. v = {};
  333. auto need_comma = it != s.data();
  334. for(;;)
  335. {
  336. detail::skip_ows(it, (s.data() + s.size()));
  337. if(it == (s.data() + s.size()))
  338. {
  339. it = nullptr;
  340. return true;
  341. }
  342. auto const c = *it;
  343. if(detail::is_token_char(c))
  344. {
  345. if(need_comma)
  346. return false;
  347. auto const p0 = it;
  348. for(;;)
  349. {
  350. ++it;
  351. if(it == (s.data() + s.size()))
  352. break;
  353. if(! detail::is_token_char(*it))
  354. break;
  355. }
  356. v = string_view{p0,
  357. static_cast<std::size_t>(it - p0)};
  358. return true;
  359. }
  360. if(c != ',')
  361. return false;
  362. need_comma = false;
  363. ++it;
  364. }
  365. }
  366. } // detail
  367. } // http
  368. } // beast
  369. } // boost
  370. #endif // BOOST_BEAST_HTTP_DETAIL_RFC7230_IPP