xref: /openbmc/linux/lib/lzo/lzo1x_compress.c (revision 09c434b8a0047c69e48499de0107de312901e798)
1*09c434b8SThomas Gleixner // SPDX-License-Identifier: GPL-2.0-only
264c70b1cSRichard Purdie /*
38b975bd3SMarkus F.X.J. Oberhumer  *  LZO1X Compressor from LZO
464c70b1cSRichard Purdie  *
58b975bd3SMarkus F.X.J. Oberhumer  *  Copyright (C) 1996-2012 Markus F.X.J. Oberhumer <markus@oberhumer.com>
664c70b1cSRichard Purdie  *
764c70b1cSRichard Purdie  *  The full LZO package can be found at:
864c70b1cSRichard Purdie  *  http://www.oberhumer.com/opensource/lzo/
964c70b1cSRichard Purdie  *
108b975bd3SMarkus F.X.J. Oberhumer  *  Changed for Linux kernel use by:
1164c70b1cSRichard Purdie  *  Nitin Gupta <nitingupta910@gmail.com>
1264c70b1cSRichard Purdie  *  Richard Purdie <rpurdie@openedhand.com>
1364c70b1cSRichard Purdie  */
1464c70b1cSRichard Purdie 
1564c70b1cSRichard Purdie #include <linux/module.h>
1664c70b1cSRichard Purdie #include <linux/kernel.h>
1764c70b1cSRichard Purdie #include <asm/unaligned.h>
188b975bd3SMarkus F.X.J. Oberhumer #include <linux/lzo.h>
1964c70b1cSRichard Purdie #include "lzodefs.h"
2064c70b1cSRichard Purdie 
2164c70b1cSRichard Purdie static noinline size_t
228b975bd3SMarkus F.X.J. Oberhumer lzo1x_1_do_compress(const unsigned char *in, size_t in_len,
238b975bd3SMarkus F.X.J. Oberhumer 		    unsigned char *out, size_t *out_len,
2445ec975eSDave Rodgman 		    size_t ti, void *wrkmem, signed char *state_offset,
2545ec975eSDave Rodgman 		    const unsigned char bitstream_version)
2664c70b1cSRichard Purdie {
278b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char *ip;
288b975bd3SMarkus F.X.J. Oberhumer 	unsigned char *op;
2964c70b1cSRichard Purdie 	const unsigned char * const in_end = in + in_len;
308b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char * const ip_end = in + in_len - 20;
318b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char *ii;
328b975bd3SMarkus F.X.J. Oberhumer 	lzo_dict_t * const dict = (lzo_dict_t *) wrkmem;
3364c70b1cSRichard Purdie 
348b975bd3SMarkus F.X.J. Oberhumer 	op = out;
358b975bd3SMarkus F.X.J. Oberhumer 	ip = in;
368b975bd3SMarkus F.X.J. Oberhumer 	ii = ip;
378b975bd3SMarkus F.X.J. Oberhumer 	ip += ti < 4 ? 4 - ti : 0;
3864c70b1cSRichard Purdie 
3964c70b1cSRichard Purdie 	for (;;) {
405ee4014aSDave Rodgman 		const unsigned char *m_pos = NULL;
418b975bd3SMarkus F.X.J. Oberhumer 		size_t t, m_len, m_off;
428b975bd3SMarkus F.X.J. Oberhumer 		u32 dv;
435ee4014aSDave Rodgman 		u32 run_length = 0;
4464c70b1cSRichard Purdie literal:
458b975bd3SMarkus F.X.J. Oberhumer 		ip += 1 + ((ip - ii) >> 5);
468b975bd3SMarkus F.X.J. Oberhumer next:
4764c70b1cSRichard Purdie 		if (unlikely(ip >= ip_end))
4864c70b1cSRichard Purdie 			break;
498b975bd3SMarkus F.X.J. Oberhumer 		dv = get_unaligned_le32(ip);
505ee4014aSDave Rodgman 
5145ec975eSDave Rodgman 		if (dv == 0 && bitstream_version) {
525ee4014aSDave Rodgman 			const unsigned char *ir = ip + 4;
535ee4014aSDave Rodgman 			const unsigned char *limit = ip_end
545ee4014aSDave Rodgman 				< (ip + MAX_ZERO_RUN_LENGTH + 1)
555ee4014aSDave Rodgman 				? ip_end : ip + MAX_ZERO_RUN_LENGTH + 1;
565ee4014aSDave Rodgman #if defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && \
575ee4014aSDave Rodgman 	defined(LZO_FAST_64BIT_MEMORY_ACCESS)
585ee4014aSDave Rodgman 			u64 dv64;
595ee4014aSDave Rodgman 
605ee4014aSDave Rodgman 			for (; (ir + 32) <= limit; ir += 32) {
615ee4014aSDave Rodgman 				dv64 = get_unaligned((u64 *)ir);
625ee4014aSDave Rodgman 				dv64 |= get_unaligned((u64 *)ir + 1);
635ee4014aSDave Rodgman 				dv64 |= get_unaligned((u64 *)ir + 2);
645ee4014aSDave Rodgman 				dv64 |= get_unaligned((u64 *)ir + 3);
655ee4014aSDave Rodgman 				if (dv64)
665ee4014aSDave Rodgman 					break;
675ee4014aSDave Rodgman 			}
685ee4014aSDave Rodgman 			for (; (ir + 8) <= limit; ir += 8) {
695ee4014aSDave Rodgman 				dv64 = get_unaligned((u64 *)ir);
705ee4014aSDave Rodgman 				if (dv64) {
715ee4014aSDave Rodgman #  if defined(__LITTLE_ENDIAN)
725ee4014aSDave Rodgman 					ir += __builtin_ctzll(dv64) >> 3;
735ee4014aSDave Rodgman #  elif defined(__BIG_ENDIAN)
745ee4014aSDave Rodgman 					ir += __builtin_clzll(dv64) >> 3;
755ee4014aSDave Rodgman #  else
765ee4014aSDave Rodgman #    error "missing endian definition"
775ee4014aSDave Rodgman #  endif
785ee4014aSDave Rodgman 					break;
795ee4014aSDave Rodgman 				}
805ee4014aSDave Rodgman 			}
815ee4014aSDave Rodgman #else
825ee4014aSDave Rodgman 			while ((ir < (const unsigned char *)
835ee4014aSDave Rodgman 					ALIGN((uintptr_t)ir, 4)) &&
845ee4014aSDave Rodgman 					(ir < limit) && (*ir == 0))
855ee4014aSDave Rodgman 				ir++;
865ee4014aSDave Rodgman 			for (; (ir + 4) <= limit; ir += 4) {
875ee4014aSDave Rodgman 				dv = *((u32 *)ir);
885ee4014aSDave Rodgman 				if (dv) {
895ee4014aSDave Rodgman #  if defined(__LITTLE_ENDIAN)
905ee4014aSDave Rodgman 					ir += __builtin_ctz(dv) >> 3;
915ee4014aSDave Rodgman #  elif defined(__BIG_ENDIAN)
925ee4014aSDave Rodgman 					ir += __builtin_clz(dv) >> 3;
935ee4014aSDave Rodgman #  else
945ee4014aSDave Rodgman #    error "missing endian definition"
955ee4014aSDave Rodgman #  endif
965ee4014aSDave Rodgman 					break;
975ee4014aSDave Rodgman 				}
985ee4014aSDave Rodgman 			}
995ee4014aSDave Rodgman #endif
1005ee4014aSDave Rodgman 			while (likely(ir < limit) && unlikely(*ir == 0))
1015ee4014aSDave Rodgman 				ir++;
1025ee4014aSDave Rodgman 			run_length = ir - ip;
1035ee4014aSDave Rodgman 			if (run_length > MAX_ZERO_RUN_LENGTH)
1045ee4014aSDave Rodgman 				run_length = MAX_ZERO_RUN_LENGTH;
1055ee4014aSDave Rodgman 		} else {
1068b975bd3SMarkus F.X.J. Oberhumer 			t = ((dv * 0x1824429d) >> (32 - D_BITS)) & D_MASK;
1078b975bd3SMarkus F.X.J. Oberhumer 			m_pos = in + dict[t];
1088b975bd3SMarkus F.X.J. Oberhumer 			dict[t] = (lzo_dict_t) (ip - in);
1098b975bd3SMarkus F.X.J. Oberhumer 			if (unlikely(dv != get_unaligned_le32(m_pos)))
1108b975bd3SMarkus F.X.J. Oberhumer 				goto literal;
1115ee4014aSDave Rodgman 		}
11264c70b1cSRichard Purdie 
1138b975bd3SMarkus F.X.J. Oberhumer 		ii -= ti;
1148b975bd3SMarkus F.X.J. Oberhumer 		ti = 0;
1158b975bd3SMarkus F.X.J. Oberhumer 		t = ip - ii;
1168b975bd3SMarkus F.X.J. Oberhumer 		if (t != 0) {
11764c70b1cSRichard Purdie 			if (t <= 3) {
1185ee4014aSDave Rodgman 				op[*state_offset] |= t;
1198b975bd3SMarkus F.X.J. Oberhumer 				COPY4(op, ii);
1208b975bd3SMarkus F.X.J. Oberhumer 				op += t;
1218b975bd3SMarkus F.X.J. Oberhumer 			} else if (t <= 16) {
1228b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (t - 3);
1238b975bd3SMarkus F.X.J. Oberhumer 				COPY8(op, ii);
1248b975bd3SMarkus F.X.J. Oberhumer 				COPY8(op + 8, ii + 8);
1258b975bd3SMarkus F.X.J. Oberhumer 				op += t;
1268b975bd3SMarkus F.X.J. Oberhumer 			} else {
1278b975bd3SMarkus F.X.J. Oberhumer 				if (t <= 18) {
12864c70b1cSRichard Purdie 					*op++ = (t - 3);
12964c70b1cSRichard Purdie 				} else {
13064c70b1cSRichard Purdie 					size_t tt = t - 18;
13164c70b1cSRichard Purdie 					*op++ = 0;
1328b975bd3SMarkus F.X.J. Oberhumer 					while (unlikely(tt > 255)) {
13364c70b1cSRichard Purdie 						tt -= 255;
13464c70b1cSRichard Purdie 						*op++ = 0;
13564c70b1cSRichard Purdie 					}
13664c70b1cSRichard Purdie 					*op++ = tt;
13764c70b1cSRichard Purdie 				}
13864c70b1cSRichard Purdie 				do {
1398b975bd3SMarkus F.X.J. Oberhumer 					COPY8(op, ii);
1408b975bd3SMarkus F.X.J. Oberhumer 					COPY8(op + 8, ii + 8);
1418b975bd3SMarkus F.X.J. Oberhumer 					op += 16;
1428b975bd3SMarkus F.X.J. Oberhumer 					ii += 16;
1438b975bd3SMarkus F.X.J. Oberhumer 					t -= 16;
1448b975bd3SMarkus F.X.J. Oberhumer 				} while (t >= 16);
1458b975bd3SMarkus F.X.J. Oberhumer 				if (t > 0) do {
14664c70b1cSRichard Purdie 					*op++ = *ii++;
14764c70b1cSRichard Purdie 				} while (--t > 0);
14864c70b1cSRichard Purdie 			}
1498b975bd3SMarkus F.X.J. Oberhumer 		}
15064c70b1cSRichard Purdie 
1515ee4014aSDave Rodgman 		if (unlikely(run_length)) {
1525ee4014aSDave Rodgman 			ip += run_length;
1535ee4014aSDave Rodgman 			run_length -= MIN_ZERO_RUN_LENGTH;
1545ee4014aSDave Rodgman 			put_unaligned_le32((run_length << 21) | 0xfffc18
1555ee4014aSDave Rodgman 					   | (run_length & 0x7), op);
1565ee4014aSDave Rodgman 			op += 4;
1575ee4014aSDave Rodgman 			run_length = 0;
1585ee4014aSDave Rodgman 			*state_offset = -3;
1595ee4014aSDave Rodgman 			goto finished_writing_instruction;
1605ee4014aSDave Rodgman 		}
1615ee4014aSDave Rodgman 
1628b975bd3SMarkus F.X.J. Oberhumer 		m_len = 4;
1638b975bd3SMarkus F.X.J. Oberhumer 		{
1648b975bd3SMarkus F.X.J. Oberhumer #if defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && defined(LZO_USE_CTZ64)
1658b975bd3SMarkus F.X.J. Oberhumer 		u64 v;
1668b975bd3SMarkus F.X.J. Oberhumer 		v = get_unaligned((const u64 *) (ip + m_len)) ^
1678b975bd3SMarkus F.X.J. Oberhumer 		    get_unaligned((const u64 *) (m_pos + m_len));
1688b975bd3SMarkus F.X.J. Oberhumer 		if (unlikely(v == 0)) {
1698b975bd3SMarkus F.X.J. Oberhumer 			do {
1708b975bd3SMarkus F.X.J. Oberhumer 				m_len += 8;
1718b975bd3SMarkus F.X.J. Oberhumer 				v = get_unaligned((const u64 *) (ip + m_len)) ^
1728b975bd3SMarkus F.X.J. Oberhumer 				    get_unaligned((const u64 *) (m_pos + m_len));
1738b975bd3SMarkus F.X.J. Oberhumer 				if (unlikely(ip + m_len >= ip_end))
1748b975bd3SMarkus F.X.J. Oberhumer 					goto m_len_done;
1758b975bd3SMarkus F.X.J. Oberhumer 			} while (v == 0);
1768b975bd3SMarkus F.X.J. Oberhumer 		}
1778b975bd3SMarkus F.X.J. Oberhumer #  if defined(__LITTLE_ENDIAN)
1788b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_ctzll(v) / 8;
1798b975bd3SMarkus F.X.J. Oberhumer #  elif defined(__BIG_ENDIAN)
1808b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_clzll(v) / 8;
1818b975bd3SMarkus F.X.J. Oberhumer #  else
1828b975bd3SMarkus F.X.J. Oberhumer #    error "missing endian definition"
1838b975bd3SMarkus F.X.J. Oberhumer #  endif
1848b975bd3SMarkus F.X.J. Oberhumer #elif defined(CONFIG_HAVE_EFFICIENT_UNALIGNED_ACCESS) && defined(LZO_USE_CTZ32)
1858b975bd3SMarkus F.X.J. Oberhumer 		u32 v;
1868b975bd3SMarkus F.X.J. Oberhumer 		v = get_unaligned((const u32 *) (ip + m_len)) ^
1878b975bd3SMarkus F.X.J. Oberhumer 		    get_unaligned((const u32 *) (m_pos + m_len));
1888b975bd3SMarkus F.X.J. Oberhumer 		if (unlikely(v == 0)) {
1898b975bd3SMarkus F.X.J. Oberhumer 			do {
1908b975bd3SMarkus F.X.J. Oberhumer 				m_len += 4;
1918b975bd3SMarkus F.X.J. Oberhumer 				v = get_unaligned((const u32 *) (ip + m_len)) ^
1928b975bd3SMarkus F.X.J. Oberhumer 				    get_unaligned((const u32 *) (m_pos + m_len));
1938b975bd3SMarkus F.X.J. Oberhumer 				if (v != 0)
1948b975bd3SMarkus F.X.J. Oberhumer 					break;
1958b975bd3SMarkus F.X.J. Oberhumer 				m_len += 4;
1968b975bd3SMarkus F.X.J. Oberhumer 				v = get_unaligned((const u32 *) (ip + m_len)) ^
1978b975bd3SMarkus F.X.J. Oberhumer 				    get_unaligned((const u32 *) (m_pos + m_len));
1988b975bd3SMarkus F.X.J. Oberhumer 				if (unlikely(ip + m_len >= ip_end))
1998b975bd3SMarkus F.X.J. Oberhumer 					goto m_len_done;
2008b975bd3SMarkus F.X.J. Oberhumer 			} while (v == 0);
2018b975bd3SMarkus F.X.J. Oberhumer 		}
2028b975bd3SMarkus F.X.J. Oberhumer #  if defined(__LITTLE_ENDIAN)
2038b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_ctz(v) / 8;
2048b975bd3SMarkus F.X.J. Oberhumer #  elif defined(__BIG_ENDIAN)
2058b975bd3SMarkus F.X.J. Oberhumer 		m_len += (unsigned) __builtin_clz(v) / 8;
2068b975bd3SMarkus F.X.J. Oberhumer #  else
2078b975bd3SMarkus F.X.J. Oberhumer #    error "missing endian definition"
2088b975bd3SMarkus F.X.J. Oberhumer #  endif
2098b975bd3SMarkus F.X.J. Oberhumer #else
2108b975bd3SMarkus F.X.J. Oberhumer 		if (unlikely(ip[m_len] == m_pos[m_len])) {
2118b975bd3SMarkus F.X.J. Oberhumer 			do {
2128b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2138b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2148b975bd3SMarkus F.X.J. Oberhumer 					break;
2158b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2168b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2178b975bd3SMarkus F.X.J. Oberhumer 					break;
2188b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2198b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2208b975bd3SMarkus F.X.J. Oberhumer 					break;
2218b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2228b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2238b975bd3SMarkus F.X.J. Oberhumer 					break;
2248b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2258b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2268b975bd3SMarkus F.X.J. Oberhumer 					break;
2278b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2288b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2298b975bd3SMarkus F.X.J. Oberhumer 					break;
2308b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2318b975bd3SMarkus F.X.J. Oberhumer 				if (ip[m_len] != m_pos[m_len])
2328b975bd3SMarkus F.X.J. Oberhumer 					break;
2338b975bd3SMarkus F.X.J. Oberhumer 				m_len += 1;
2348b975bd3SMarkus F.X.J. Oberhumer 				if (unlikely(ip + m_len >= ip_end))
2358b975bd3SMarkus F.X.J. Oberhumer 					goto m_len_done;
2368b975bd3SMarkus F.X.J. Oberhumer 			} while (ip[m_len] == m_pos[m_len]);
2378b975bd3SMarkus F.X.J. Oberhumer 		}
2388b975bd3SMarkus F.X.J. Oberhumer #endif
2398b975bd3SMarkus F.X.J. Oberhumer 		}
2408b975bd3SMarkus F.X.J. Oberhumer m_len_done:
24164c70b1cSRichard Purdie 
2428b975bd3SMarkus F.X.J. Oberhumer 		m_off = ip - m_pos;
2438b975bd3SMarkus F.X.J. Oberhumer 		ip += m_len;
2448b975bd3SMarkus F.X.J. Oberhumer 		if (m_len <= M2_MAX_LEN && m_off <= M2_MAX_OFFSET) {
24564c70b1cSRichard Purdie 			m_off -= 1;
2468b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (((m_len - 1) << 5) | ((m_off & 7) << 2));
24764c70b1cSRichard Purdie 			*op++ = (m_off >> 3);
24864c70b1cSRichard Purdie 		} else if (m_off <= M3_MAX_OFFSET) {
24964c70b1cSRichard Purdie 			m_off -= 1;
2508b975bd3SMarkus F.X.J. Oberhumer 			if (m_len <= M3_MAX_LEN)
25164c70b1cSRichard Purdie 				*op++ = (M3_MARKER | (m_len - 2));
2528b975bd3SMarkus F.X.J. Oberhumer 			else {
2538b975bd3SMarkus F.X.J. Oberhumer 				m_len -= M3_MAX_LEN;
25464c70b1cSRichard Purdie 				*op++ = M3_MARKER | 0;
2558b975bd3SMarkus F.X.J. Oberhumer 				while (unlikely(m_len > 255)) {
25664c70b1cSRichard Purdie 					m_len -= 255;
25764c70b1cSRichard Purdie 					*op++ = 0;
25864c70b1cSRichard Purdie 				}
25964c70b1cSRichard Purdie 				*op++ = (m_len);
26064c70b1cSRichard Purdie 			}
2618b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (m_off << 2);
2628b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (m_off >> 6);
2638b975bd3SMarkus F.X.J. Oberhumer 		} else {
2648b975bd3SMarkus F.X.J. Oberhumer 			m_off -= 0x4000;
2658b975bd3SMarkus F.X.J. Oberhumer 			if (m_len <= M4_MAX_LEN)
2668b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (M4_MARKER | ((m_off >> 11) & 8)
2678b975bd3SMarkus F.X.J. Oberhumer 						| (m_len - 2));
2688b975bd3SMarkus F.X.J. Oberhumer 			else {
2698b975bd3SMarkus F.X.J. Oberhumer 				m_len -= M4_MAX_LEN;
2708b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (M4_MARKER | ((m_off >> 11) & 8));
2718b975bd3SMarkus F.X.J. Oberhumer 				while (unlikely(m_len > 255)) {
2728b975bd3SMarkus F.X.J. Oberhumer 					m_len -= 255;
2738b975bd3SMarkus F.X.J. Oberhumer 					*op++ = 0;
27464c70b1cSRichard Purdie 				}
2758b975bd3SMarkus F.X.J. Oberhumer 				*op++ = (m_len);
2768b975bd3SMarkus F.X.J. Oberhumer 			}
2778b975bd3SMarkus F.X.J. Oberhumer 			*op++ = (m_off << 2);
27864c70b1cSRichard Purdie 			*op++ = (m_off >> 6);
27964c70b1cSRichard Purdie 		}
2805ee4014aSDave Rodgman 		*state_offset = -2;
2815ee4014aSDave Rodgman finished_writing_instruction:
2825ee4014aSDave Rodgman 		ii = ip;
2838b975bd3SMarkus F.X.J. Oberhumer 		goto next;
28464c70b1cSRichard Purdie 	}
28564c70b1cSRichard Purdie 	*out_len = op - out;
2868b975bd3SMarkus F.X.J. Oberhumer 	return in_end - (ii - ti);
28764c70b1cSRichard Purdie }
28864c70b1cSRichard Purdie 
28945ec975eSDave Rodgman int lzogeneric1x_1_compress(const unsigned char *in, size_t in_len,
2908b975bd3SMarkus F.X.J. Oberhumer 		     unsigned char *out, size_t *out_len,
29145ec975eSDave Rodgman 		     void *wrkmem, const unsigned char bitstream_version)
29264c70b1cSRichard Purdie {
2938b975bd3SMarkus F.X.J. Oberhumer 	const unsigned char *ip = in;
29464c70b1cSRichard Purdie 	unsigned char *op = out;
295b11ed18eSDave Rodgman 	unsigned char *data_start;
2968b975bd3SMarkus F.X.J. Oberhumer 	size_t l = in_len;
2978b975bd3SMarkus F.X.J. Oberhumer 	size_t t = 0;
2985ee4014aSDave Rodgman 	signed char state_offset = -2;
29945ec975eSDave Rodgman 	unsigned int m4_max_offset;
3005ee4014aSDave Rodgman 
301b11ed18eSDave Rodgman 	// LZO v0 will never write 17 as first byte (except for zero-length
302b11ed18eSDave Rodgman 	// input), so this is used to version the bitstream
30345ec975eSDave Rodgman 	if (bitstream_version > 0) {
3045ee4014aSDave Rodgman 		*op++ = 17;
30545ec975eSDave Rodgman 		*op++ = bitstream_version;
30645ec975eSDave Rodgman 		m4_max_offset = M4_MAX_OFFSET_V1;
30745ec975eSDave Rodgman 	} else {
30845ec975eSDave Rodgman 		m4_max_offset = M4_MAX_OFFSET_V0;
30945ec975eSDave Rodgman 	}
31064c70b1cSRichard Purdie 
311b11ed18eSDave Rodgman 	data_start = op;
312b11ed18eSDave Rodgman 
3138b975bd3SMarkus F.X.J. Oberhumer 	while (l > 20) {
31445ec975eSDave Rodgman 		size_t ll = l <= (m4_max_offset + 1) ? l : (m4_max_offset + 1);
3158b975bd3SMarkus F.X.J. Oberhumer 		uintptr_t ll_end = (uintptr_t) ip + ll;
3168b975bd3SMarkus F.X.J. Oberhumer 		if ((ll_end + ((t + ll) >> 5)) <= ll_end)
3178b975bd3SMarkus F.X.J. Oberhumer 			break;
3188b975bd3SMarkus F.X.J. Oberhumer 		BUILD_BUG_ON(D_SIZE * sizeof(lzo_dict_t) > LZO1X_1_MEM_COMPRESS);
3198b975bd3SMarkus F.X.J. Oberhumer 		memset(wrkmem, 0, D_SIZE * sizeof(lzo_dict_t));
32045ec975eSDave Rodgman 		t = lzo1x_1_do_compress(ip, ll, op, out_len, t, wrkmem,
32145ec975eSDave Rodgman 					&state_offset, bitstream_version);
3228b975bd3SMarkus F.X.J. Oberhumer 		ip += ll;
32364c70b1cSRichard Purdie 		op += *out_len;
3248b975bd3SMarkus F.X.J. Oberhumer 		l  -= ll;
32564c70b1cSRichard Purdie 	}
3268b975bd3SMarkus F.X.J. Oberhumer 	t += l;
32764c70b1cSRichard Purdie 
32864c70b1cSRichard Purdie 	if (t > 0) {
3298b975bd3SMarkus F.X.J. Oberhumer 		const unsigned char *ii = in + in_len - t;
33064c70b1cSRichard Purdie 
331b11ed18eSDave Rodgman 		if (op == data_start && t <= 238) {
33264c70b1cSRichard Purdie 			*op++ = (17 + t);
33364c70b1cSRichard Purdie 		} else if (t <= 3) {
3345ee4014aSDave Rodgman 			op[state_offset] |= t;
33564c70b1cSRichard Purdie 		} else if (t <= 18) {
33664c70b1cSRichard Purdie 			*op++ = (t - 3);
33764c70b1cSRichard Purdie 		} else {
33864c70b1cSRichard Purdie 			size_t tt = t - 18;
33964c70b1cSRichard Purdie 			*op++ = 0;
34064c70b1cSRichard Purdie 			while (tt > 255) {
34164c70b1cSRichard Purdie 				tt -= 255;
34264c70b1cSRichard Purdie 				*op++ = 0;
34364c70b1cSRichard Purdie 			}
34464c70b1cSRichard Purdie 			*op++ = tt;
34564c70b1cSRichard Purdie 		}
3468b975bd3SMarkus F.X.J. Oberhumer 		if (t >= 16) do {
3478b975bd3SMarkus F.X.J. Oberhumer 			COPY8(op, ii);
3488b975bd3SMarkus F.X.J. Oberhumer 			COPY8(op + 8, ii + 8);
3498b975bd3SMarkus F.X.J. Oberhumer 			op += 16;
3508b975bd3SMarkus F.X.J. Oberhumer 			ii += 16;
3518b975bd3SMarkus F.X.J. Oberhumer 			t -= 16;
3528b975bd3SMarkus F.X.J. Oberhumer 		} while (t >= 16);
3538b975bd3SMarkus F.X.J. Oberhumer 		if (t > 0) do {
35464c70b1cSRichard Purdie 			*op++ = *ii++;
35564c70b1cSRichard Purdie 		} while (--t > 0);
35664c70b1cSRichard Purdie 	}
35764c70b1cSRichard Purdie 
35864c70b1cSRichard Purdie 	*op++ = M4_MARKER | 1;
35964c70b1cSRichard Purdie 	*op++ = 0;
36064c70b1cSRichard Purdie 	*op++ = 0;
36164c70b1cSRichard Purdie 
36264c70b1cSRichard Purdie 	*out_len = op - out;
36364c70b1cSRichard Purdie 	return LZO_E_OK;
36464c70b1cSRichard Purdie }
36545ec975eSDave Rodgman 
36645ec975eSDave Rodgman int lzo1x_1_compress(const unsigned char *in, size_t in_len,
36745ec975eSDave Rodgman 		     unsigned char *out, size_t *out_len,
36845ec975eSDave Rodgman 		     void *wrkmem)
36945ec975eSDave Rodgman {
37045ec975eSDave Rodgman 	return lzogeneric1x_1_compress(in, in_len, out, out_len, wrkmem, 0);
37145ec975eSDave Rodgman }
37245ec975eSDave Rodgman 
37345ec975eSDave Rodgman int lzorle1x_1_compress(const unsigned char *in, size_t in_len,
37445ec975eSDave Rodgman 		     unsigned char *out, size_t *out_len,
37545ec975eSDave Rodgman 		     void *wrkmem)
37645ec975eSDave Rodgman {
37745ec975eSDave Rodgman 	return lzogeneric1x_1_compress(in, in_len, out, out_len,
37845ec975eSDave Rodgman 				       wrkmem, LZO_VERSION);
37945ec975eSDave Rodgman }
38045ec975eSDave Rodgman 
38164c70b1cSRichard Purdie EXPORT_SYMBOL_GPL(lzo1x_1_compress);
38245ec975eSDave Rodgman EXPORT_SYMBOL_GPL(lzorle1x_1_compress);
38364c70b1cSRichard Purdie 
38464c70b1cSRichard Purdie MODULE_LICENSE("GPL");
38564c70b1cSRichard Purdie MODULE_DESCRIPTION("LZO1X-1 Compressor");
386